Кухни по поръчка | Съвети за мода и красота | Ваучери за намаления

AI чатботовете разказват истории за „Елиас Торн“ и никой не знае кой е той

Кой е Елиас Торн? Той често се появява в историите, разказвани от чатботовете с изкуствен интелект, както за първи път забеляза софтуерният инженер Даниел Мей, но никой не знаеше защо – досега. Според нова научна статия в предпечат, за която първи съобщи 404 Media, разпространението на легендата за мистериозния Елиас Торн може да е свързано с предпазните механизми, въведени в AI моделите по време на обучението им за безопасност и съгласуваност.

Ако искате да се запознаете с цялата история около Елиас Торн, статията, публикувана от изследователите Сил Хамилтън и Дейвид Мимно от Корнелския университет е добро място за начало. Те дават на няколко AI модела, включително GPT-5.4 Mini на OpenAI, Claude Haiku 4.5 на Anthropic и Gemini 3.1 Flash-Lite на Google пет различни подсказки за генериране на истории. В около 20 000 истории, генерирани от AI моделите те откриха шокиращо количество повторения: 11 думи – „фара“, „пазач“, „пекар“, „кмет“, „часовникар“, „рибар“, „библиотекар“, „диригент“ и имената „Мара“, „Елиас“ и „Елара“ се появяват в цели 88% от всички истории.

Няма комбинация от този невероятно ограничен набор от съществителни, използвани за разказване на истории, която да се появява по-често от „Елиас, пазачът на фара“ – този образ се среща в 2/3 от всички генерирани истории. Това до голяма степен съвпада с примерите, посочени от Мей, която също накара няколко различни модела да напишат истории и установи, че същият „Елиас, пазачът на фара“ се появява отново и отново.

И така, какво точно се случва?

Изследователите предположиха, че това може да има нещо общо с данните от предварителното обучение, въведени в тези AI модели, но бързо отхвърлиха тази хипотеза, когато не можаха да намерят нищо, което да подсказва, че „Елиас, пазачът на фара“ се появява с прекомерна честота в данните от предварителното обучение или в литературата, използвана при обучението.

Вместо това те приписват проблема на използването на конкретни набори от данни, които са се превърнали в широко разпространени сред лабораториите за изкуствен интелект. Като възможен пример те посочват WildChat – набор от данни с отворен код, съдържащ милиони разговори между хора и чатбот, задвижван от GPT-3.5. Наборът от данни е създаден, за да помогне на изследователите да разберат как хората общуват с ботове, но оттогава се използва за обучение на много различни модели. Те изказват хипотезата, че обучението за привеждане в съответствие, предназначено да отклони моделите от защитени с авторски права герои и съдържание за възрастни, може неволно да е дало необичайна популярност на „безопасни“ алтернативи, като „Елиас, пазачът на фара“, което води до това те да се появяват многократно, когато потребителите помолят модела да генерира история.

„Елиас Торн, пазачът на фара“ може и да е подходящ за детска приказка за лека нощ, но 404 Media съобщи, че изглежда името на този герой се разпространява. Изданието откри примери, в които това име фигурира като име на главен герой във фентъзи книги, както и като „изпълнител“ на албуми с музика, предлагани в Amazon. Май откри и примери, в които Елиас Торн е посочен като автор на книги, включително на наръчник, който твърди, че предоставя информация за алтернативни методи за лечение на рак, така че това не е много добре.

Коментари
Все още няма коментари