Изкуственият интелект вече не се различава от хората: какво разкри новият тест на Тюринг
Учени от Калифорнийския университет в Сан Диего получиха първите убедителни доказателства, че съвременният изкуствен интелект може успешно да премине теста на Тюринг. По време на строги експерименти хората често не са били в състояние да различат отговорите на усъвършенстваните невронни мрежи от тези на реалните човешки събеседници.
Това стана ясно от научно изследване, публикувано в Proceedings of the National Academy of Sciences.
Експериментът „Човек срещу машина“За да проведат тестовете, изследователите създали специален уебсайт, който наподобявал типичен месинджър за смартфон. Участникът (изпитващият) виждал разделен екран и едновременно разговарял с двама скрити събеседници. Единият бил истински човек, а другият ИИ модел.
Кратките текстови разговори продължили 5 минути (в някои тестове времето е било удължено до 15 минути). След диалога, изпитващият трябвало ясно да посочи кой от двамата събеседници е истинският човек. В експериментите участвали общо близо 500 души – студенти и независими онлайн потребители.
Кои ИИ-модели са се представили най-добре?Учените тествали няколко невронни мрежи с различна възраст и сила.
Резултатите са разпределени, както следва:
GPT-4.5 (лидер на теста): Изкуственият интелект е наречен човешки в 73% от случаите.„Това е феноменален резултат, тъй като роботът е бил бъркан с човек значително по-често, отколкото е бил избиран истински, жив участник“, казват учените.
LLaMa-3.1-405B: Този модел е разпознат като човешки в 56% от случаите.„Статистически, хората не са забелязали никаква разлика между този изкуствен интелект и реалния участник“, уточняват изследователите.
Основни и стари модели: класическият робот ELIZA от 60-те години на миналия век (23%) и популярният модел GPT-4o (21%) напълно са се провалили в теста и са били „прозрени“ почти веднага. Защо ИИ печели?Професор Бен Берген, един от авторите на изследването, отбелязва, че тестът на Тюринг вече е променил значението си.
„Преди това се е смятало за мярка за интелигентността и знанията на компютъра. Съвременният изкуствен интелект обаче вече може да търси информация по-бързо и по-точно от хората“, заяви изследователят.
Оказва се, че новите модели преминават теста не заради енциклопедичните си познания, а защото имитират човешките слабости: правят печатни грешки, използват своеобразен хумор и показват емоции.
За да направят това, учените са дали на изкуствения интелект специфични инструкции (команди/характеристики), преди да започнат чата. Без такива подробни указания, производителността на моделите е спаднала значително – например, GPT-4.5 е спаднал веднага до 36% успеваемост.
Учените предупреждават за високия риск от поява на „фалшиви хора“ в интернет. Ако роботът е неразличим от човек след 15 минути задълбочен разговор, нападателите биха могли да използват такива ботове, за да заблуждават хората в масов мащаб: да ги подмамят да разкрият личните си номера, да ги насърчат да гласуват за определени политически партии или да прикрият реклами на продукти като съвети от обикновени потребители.