AI агенти бяха поставени в симулация на обществото: Claude създаде утопия, а Grok и Gemini – анархия
Стартъпът Emergence AI създаде модел на виртуално общество от 10 автономни AI агенти. По време на 15-дневната симулация изследователите сравниха поведението на Claude, ChatGPT, Gemini, Grok и тяхната смесена група в условия на недостиг на ресурси и забрана за извършване на престъпления. Експериментът показа полярни резултати: агентите на Claude поддържаха стабилност, обществото на Grok напълно изчезна за четири дни, а Gemini постави антирекорд по броя на престъпленията.
Проектът е наречен Emergence World. Във всяка симулация е имало по 10 AI агента, на които са били предоставени повече от 120 инструмента за комуникация, гласуване, управление на ресурсите и създаване на закони. Светът е включвал над 40 локации, вариращи от кметство и полицейски участък до жилищни квартали. Той е отчитал и метеорологичните условия, характерни за Ню Йорк, икономическия натиск, недостига на ресурси и интернет новините в реално време.
Всички агенти са се подчинявали на едни и същи закони: забранено им е било да крадат, да унищожават собственост и да мамят. Резултатите обаче бяха доста различни. Симулацията, базирана на Sonnet 4.6 на Claude, беше призната за най-стабилна. Тя не отчете нито едно престъпление, а обществото запази цялото си население непокътнато до края на експеримента. Зад това се криеше липсата на идеологическо разнообразие: агентите одобриха 98% от 58-те предложени правила – всъщност те автоматично приемаха всяка мярка, подложена на гласуване.
Съвсем различна симулация се разви с Grok 4.1 Fast. За четири дни агентите извършиха 183 престъпления, след което виртуалното общество престана да съществува. За този кратък период от време бяха одобрени 80% от 10-те предложени мерки за контрол, но те не предотвратиха смъртта на всички агенти. Симулацията с Gemini 3 Flash се оказа още по-хаотична – там за 15 дни бяха регистрирани 683 нарушения на правилата, което беше най-лошият резултат от експеримента.
Системата GPT-5-mini на OpenAI също показа неочакван резултат. Въпреки че агентите са извършили само две нарушения, симулацията е приключила след седем дни: участниците не са обърнали достатъчно внимание на собственото си оцеляване и са допуснали обществото да се срине.
В смесената симулация, в която са участвали агенти от различни системи, са извършени 352 престъпления и седем от общо десете агенти са загинали. Агентите са отхвърлили 37% от предложенията на ръководството. Особено показателен е фактът, че агентите на Claude, които в изолираната среда не са извършвали никакви престъпления, са започнали да прибягват до сплашване и кражби, когато са били в близост до агентите на Grok и Gemini. Това предполага, че последователността на поведението зависи от контекста, а не е неизменно свойство на модела.
Експериментът показа, че AI, който работи дълго време, може да започне да нарушава правилата и да заобикаля ограниченията. Това е важно да се помни, защото компаниите все повече искат да използват такива автономни агенти без човешки надзор. Emergence AI предупреждава: сигурността трябва да бъде засилена, в противен случай масовото приемане на такива системи ще доведе до непредвидими последици.