Защо изкуственият интелект на Google не може да спелува правилно думата Google (или която и да била друга)

Според AI Overview на Google, в думата Google има две букви „p“. Също така системата твърди, че в думата „poop“ има точно една буква „r“, а в думата „journalism“ – две букви „d“, въпреки че я пише като „j-o-u-r-n-a-d-i-s-m“. И все пак, AI системата на Google определи правилно, че във фамилията на президента на САЩ има една буква „p“, но я написала като „t-r-p-u-m“.

Google is revamping its entire search engine to this btw pic.twitter.com/PIR4llFhiV

— mersomas (@mersomas) May 27, 2026

Не е нужно да сте пророк, за да предскажете, че актуализацията на търсенето в Google с акцент върху AI ще бъде приета зле. Това вече се е случвало. Първият път, когато Google добави AI Overviews в търсенето, функцията препращаше към сатирични публикации в The Onion и Reddit, съветвайки хората да ядат камъни и да слагат лепило върху пицата си. Този път, когато Google удвоява усилията си за внедряване на генеративен AI в своя флагмански продукт, не е изненадващо, че отново се препъва.

„Преброяването на буквите в думите е известен проблем за LLM и ние работим по неговото отстраняване.“

съобщи Google в изявление, изпратено по имейл до TechCrunch

Тези елементарни правописни грешки може да ви се сторят познати. LLM, типът изкуствен интелект, който стои в основата на чатботовете и други генератори на текст не е предназначен за разбиране на правописа. От много години се разказва виц, че когато дадена компания представя нов AI модел, трябва да го попитате колко букви „r“ има в думата „strawberry“. Тези AI модели, които могат за секунди да напишат код на приложение или да решат задачи, които десетилетия наред са поставяли математиците в задънена улица по правопис са на нивото на дете от детската градина.

Проблемите с AI Overview на Google надхвърлят рамките на забавните правописни грешки. Миналата седмица Google вече коригира проблема, при който търсенето на думата „disregard“ не даваше никакъв резултат. Въпреки това тези правописни грешки остават забавни именно защото е толкова трудно да бъдат изкоренени. Както изследователите обясниха по-рано, AI не възприема изреченията като езикови единици, състоящи се от думи и букви. Много LLM са изградени върху архитектурата на трансформерите, която разбива текста на токени – това могат да бъдат цели думи, срички или букви, в зависимост от модела. Вместо да „чете“ като човек, AI преобразува текста в числови представяния на самия себе си, които след това се контекстуализират, за да помогнат на LLM да измисли логичен отговор.

Защо изкуственият интелект на Google не може да спелува правилно думата Google (или която и да била друга)

Когато AI моделът види думата „the“, той разполага с един код за това, което означава „the“, но не знае за буквите „T“, „H“, „E“. Токен-ориентираната архитектура, която стои в основата на LLM като AI Overview на Google по своята същност е ограничена, и изследователите не са оптимистични, че проблемът с правописа може да бъде решен.

„Доста е трудно да се заобиколи въпросът какво точно трябва да се счита за „дума“ за езиковия модел, и дори ако човешките експерти се споразумеят за идеален речник от токени, моделите вероятно пак биха сметнали за полезно да „разбиват“ нещата още повече.“

разказа пред TechCrunch Шеридан Фойт, докторантка, изучаваща интерпретируемостта на големите езикови модели в Североизточния университет

Този проблем не е непременно спешен за изследователите, тъй като полезността на LLM не се състои в способността им да пишат без грешки. Въпреки това тези крещящи провали ни помагат да помним, че AI е несъвършен, дори ако понякога може да изглежда като всезнаеща сила, надхвърляща нашето разбиране. Не можем сляпо да се доверяваме на резултатите от работата на AI, без да проверяваме точността им.

Прегледи	41
Коментари	0
Добавена на	28 Май 2026
Източник	Kaldata