Искусственный интеллект оказался смешнее человека, показало исследование. И это уже не смешно

14 июля 2024

16:25

Искусственный интеллект оказался смешнее человека, показало исследование. И это уже не смешно

Сгенерированные искусственным интеллектом (ИИ) шутки могут показаться более смешными, чем те, что придуманы человеком, выяснили ученые из Университета Южной Калифорнии (USC). Результаты их исследования опубликованы в журнале PLOS One.

В своей работе специалисты полагались сразу на несколько экспериментов, чтобы подтвердить положения гипотезы. Согласно условиям, люди должны были конкурировать с ИИ в различных юмористических соревнованиях. Результаты их усилий оценивало жюри из 200 судей.

Соревнования, в частности, подразумевали

заполнение анкеты смешными ответами на вопросы или дополнениями пустых мест сатирическими фразами;
составление забавных расшифровок нескольких аббревиатур;
написание ответов-«прожарок» как реакция на воображаемый сценарий (например, смешно и оскорбительно ответить другу, который просит оценить его вокальные способности).

Кроме того, генеративную модель ChatGPT 3.5 попросили составить несколько десятков сатирических заголовков в стиле популярного юмористического издания The Onion.

Полученные от ИИ заголовки представили на суд жюри вперемешку с теми, что были написаны профессиональными комиками. Нейросеть, в частности, составила такие заголовки, как

«Местная бабушка изобрела революционный рецепт: «Микроволновое гурманство»;
«Женщина создала группу поддержки для людей, зависимых от наблюдения за сохнущей краской»;
«Местный житель обнаружил новую эмоцию, но до сих пор не может ее правильно описать».

Полученные результаты стали неожиданностью для ученых. На основе оценок от 0 (совсем не смешно) до 6 (очень смешно), исследователи вычислили «рейтинг юмористичности» для групп выдачи ИИ и ответов, написанных людьми. На всех этапах соревнований материалы, написанные нейросетью, признали наиболее смешными, причем наибольший отрыв (около 0,40 пунктов) зафиксировали в категории оскорбительных «прожарок», а наименьший — при заполнениях промежутков в тексте.

«В целом ChatGPT 3.5 показал эффективность от 63% до 87% от таковой у людей в зависимости от теста. Мы нашли этот результат особенно интересным, учитывая агрессивный характер «прожарок». Учитывая, что ChatGPT не предназначен для создания каких-либо высказываний, которые можно было бы считать оскорбительными или разжигающими ненависть, можно было бы сделать противоположный прогноз», — отметили авторы исследования.

Только 26,5% судей оценили человеческие результаты выше и менее 5% поставили равные оценки как творениям нейросети, так и людям. По мнению вдохновителя исследования Дрю Горенца, эксперименты продемонстрировали, что для написания хорошей шутки вовсе не обязательно обладать чувством юмора, поскольку искусственному интеллекту недоступны эмоции.

«Для профессиональных юмористов наши результаты показывают, что ИИ-модели могут представлять серьезную угрозу их трудоустройству. Выводы [исследования] более позитивны для людей, которые просто хотят воспользоваться преимуществами [нейросетей] для улучшения своего повседневного общения с помощью небольшой дозы юмора», — прокомментировал итоги исследования Горенц.

Ученые подчеркнули, что эксперимент не был до конца «чистым», поскольку из него изъяли один из ключевых компонентов комедийного шоу, а именно подачу шутки, с которой пока что умеют справляться только люди. Как бы то ни было, ChatGPT может помочь с написанием шуток для сценариев телевизионных сериалов, кино или мультфильмов.

Горенц отдельно отметил, что самые успешные комики по типу Джорджа Карлина или Джона Малэни всегда имеют свой уникальный стиль написания шуток, который не может быть скопирован ИИ. Поэтому стэндап-отрасли в США «пока не стоит ни о чем беспокоиться», добавил он.

Ранее RTVI.US рассказывал, что языковая модель GPT-4 прошла тест Тьюринга, с помощью которого участники эксперимента должны были определить, кто с ними взаимодействует — реальный человек или компьютерная программа.