Кухни по поръчка | Съвети за мода и красота | Ваучери за намаления

Изкуственият интелект вече не се различава от хората: какво разкри новият тест на Тюринг

Учени от Калифорнийския университет в Сан Диего получиха първите убедителни доказателства, че съвременният изкуствен интелект може успешно да премине теста на Тюринг. По време на строги експерименти хората често не са били в състояние да различат отговорите на усъвършенстваните невронни мрежи от тези на реалните човешки събеседници.

Това стана ясно от научно изследване, публикувано в Proceedings of the National Academy of Sciences.

Експериментът „Човек срещу машина“

За да проведат тестовете, изследователите създали специален уебсайт, който наподобявал типичен месинджър за смартфон. Участникът (изпитващият) виждал разделен екран и едновременно разговарял с двама скрити събеседници. Единият бил истински човек, а другият ИИ модел.

Кратките текстови разговори продължили 5 минути (в някои тестове времето е било удължено до 15 минути). След диалога, изпитващият трябвало ясно да посочи кой от двамата събеседници е истинският човек. В експериментите участвали общо близо 500 души – студенти и независими онлайн потребители.

Кои ИИ-модели са се представили най-добре?

Учените тествали няколко невронни мрежи с различна възраст и сила.

Резултатите са разпределени, както следва:

GPT-4.5 (лидер на теста): Изкуственият интелект е наречен човешки в 73% от случаите.

„Това е феноменален резултат, тъй като роботът е бил бъркан с човек значително по-често, отколкото е бил избиран истински, жив участник“, казват учените.

LLaMa-3.1-405B: Този модел е разпознат като човешки в 56% от случаите.

„Статистически, хората не са забелязали никаква разлика между този изкуствен интелект и реалния участник“, уточняват изследователите.

Основни и стари модели: класическият робот ELIZA от 60-те години на миналия век (23%) и популярният модел GPT-4o (21%) напълно са се провалили в теста и са били „прозрени“ почти веднага. Защо ИИ печели?

Професор Бен Берген, един от авторите на изследването, отбелязва, че тестът на Тюринг вече е променил значението си.

„Преди това се е смятало за мярка за интелигентността и знанията на компютъра. Съвременният изкуствен интелект обаче вече може да търси информация по-бързо и по-точно от хората“, заяви изследователят.

Оказва се, че новите модели преминават теста не заради енциклопедичните си познания, а защото имитират човешките слабости: правят печатни грешки, използват своеобразен хумор и показват емоции.

За да направят това, учените са дали на изкуствения интелект специфични инструкции (команди/характеристики), преди да започнат чата. Без такива подробни указания, производителността на моделите е спаднала значително – например, GPT-4.5 е спаднал веднага до 36% успеваемост.

Учените предупреждават за високия риск от поява на „фалшиви хора“ в интернет. Ако роботът е неразличим от човек след 15 минути задълбочен разговор, нападателите биха могли да използват такива ботове, за да заблуждават хората в масов мащаб: да ги подмамят да разкрият личните си номера, да ги насърчат да гласуват за определени политически партии или да прикрият реклами на продукти като съвети от обикновени потребители.

Коментари
Все още няма коментари