Ерата на безплатния изкуствен интелект е към своя край: как постепенно губим лимитите и какво ще се случи след това

Доскоро технологичните гиганти се състезаваха в щедрост, предлагайки неограничен достъп до най-мощните си разработки. През 2026 г. обаче правилата на играта се промениха драстично. Пазарът достигна повратна точка, в която изчислителните ресурси и енергия станаха твърде скъпи, за да бъдат използвани безконтролно.

Защо безплатният изкуствен интелект става все по-малко достъпен?

Днес ИИ-индустрията е изправена пред суровата реалност: стартирането и поддържането на мощни AI-модели изисква колосални финансови инвестиции. През последните години компаниите съзнателно понасяха загуби в опит да спечелят пазарен дял, но до 2026 г. този подход стана неустойчив. Според източници, партньорите на OpenAI, включително SoftBank и Oracle, са натрупали близо 100 милиарда долара дълг само за разработване на центрове за данни.

Ограниченията на физическата инфраструктура играят ключова роля в промяната на стратегията. Очаква се глобалните центрове за данни да консумират между 650 и 1050 тераватчаса електроенергия тази година, надвишавайки потреблението на страни като Япония.

„Този ход е насочен към намаляване на бариерите за разработчиците и ускоряване на разширяването на ИИ-екосистемата“, заяви по-рано главният изпълнителен директор на Google Сундар Пичай, коментирайки новата ценова политика на компанията, насочена към оптимизиране на разходите, според TradingKey.

Какво се промени в OpenAI?

OpenAI значително преработи условията за потребителите на ChatGPT. Новият базов модел, GPT-5.5, вече е достъпен за безплатните потребители с твърд лимит от 10 заявки на 5 часа. След като този лимит бъде достигнат, системата автоматично превключва разговора към опростената „mini“ версия.

Най-съвременната функция Thinking (Разсъждения) в безплатния план е ограничена до едно съобщение на ден. За тези, които се нуждаят от повече, OpenAI предлага план Plus за $20 на месец, ограничен до 80 заявки за 3 часа, или новия план Pro 5X за $100, предоставящ пет пъти повече ресурси.

Важно е да се разбере, че съвременните системи за ограничаване, особено Codex на OpenAI, вече се основават не само на броя съобщения, но и на времето за разсъждение на модела. Например, в плана Plus, една минута разсъждение на модела GPT-5.4 струва приблизително 2,5% от общия петчасов лимит.

Как Google намали лимитите си

Google също се отказа от фиксираните дневни лимити в полза на гъвкава кредитна система. Консумацията на ресурси от Gemini вече зависи от сложността на задачата: простата обработка на текст е евтина, докато генерирането на видео или анализът на големи кодови бази моментално изразходва значителна част от кредитите.

Компанията също така намали цената на своя премиум план AI Ultra от $250 на $200 на месец и въведе междинен план от $100. Това се случва на фона на бързо нарастващия пазарен дял на Google: според Similarweb, Gemini е утроил дела си до 25,46%, докато ChatGPT е спаднал от 77,43% на 56,72%.

Anthropic стана най-голямото разочарование

През последните месеци Anthropic също се сблъска с вълна от критики заради промените в политиката за ограничения на Claude. Анализирайки социалните медии обаче, забелязахме значително по-голяма вълна от недоволство, насочена към Claude, отколкото към други изкуствени интелекти.

Потребителите, особено тези с платените планове Pro и Max, започнаха масово да се оплакват, че наличният капацитет за използване на модела им се изчерпва значително по-бързо от преди. Това е особено забележимо след пускането на пазара на новите модели Claude 4.6 и инструментите Claude Code, според MacRumors.

Anthropic официално потвърди, че компанията коригира лимитите си по време на пиковите часове поради рязкото увеличение на натоварването на инфраструктурата. Това се отнася за периодите между 5:00 ч. сутринта и 11:00 ч. сутринта тихоокеанско време, когато потребителите започват да използват по-бързо своите петчасови сесии.

Компанията твърди, че общите седмични лимити не са се променили, но самият механизъм за разпределение на ресурсите е станал по-строг. Anthropic дори призна, че приблизително 7% от потребителите са започнали да достигат лимитите по-рано, отколкото преди промените.

Най-голямото недоволство беше, че тези промени бяха въведени почти без публично обявяване. Част от информацията се появи само в социалните мрежи или в коментари от служители на компанията. В Reddit и GitHub потребителите започнаха да съобщават, че Claude Max, който струва $100-$200, понякога „изгаря“ само след 30-90 минути активна употреба. Някои съобщиха, че една-единствена сложна заявка може да изразходва повече от 20% от наличния лимит.

Отделен проблем бяха така наречените „скрити“ разходи за токени. Потребителите на Claude Code подозираха, че системата е станала по-агресивна при отчитането на контекста, кеширането и процесите на вътрешния модел. Това доведе до факта, че дори прости сценарии за програмиране или редактиране на текст консумират значително повече изчислителни ресурси, тъй като системата препрочита предишния контекст всеки път. Anthropic частично потвърди съществуването на грешки в кеширането, които биха могли да ускорят потреблението на токени.

В същото време компанията започна да промотира нова система за „extra usage“ или „usage credits“. Идеята е, че след изчерпване на стандартните лимити за ползване, потребителите могат да продължат да използват Claude на кредит.

По този начин, дори платеният абонамент вече не гарантира непрекъснат достъп до услугата. Anthropic обясни ситуацията просто: съвременните ИИ модели са станали твърде скъпи за поддръжка. Нови функции като „thinking mode“, сценарии, базирани на агенти, търсене в мрежата и милионния контекстен прозорец драстично увеличават консумацията на GPU-ресурси. Компаниите по същество продават на потребителите достъп до изключително скъпи центрове за данни, а фиксираната цена на абонамента все повече не успява да покрие реалните разходи.

Здравей, реклама

Друга важна промяна беше въвеждането на реклами. OpenAI официално стартира ChatGPT Ads през февруари 2026 г. за потребителите с безплатен и основен план в САЩ. Рекламите се интегрират директно в разговорите като спонсорирани препоръки, като разходите достигат 60 долара на 1000 импресии.

За разлика от лидерите на пазара, търсачката Perplexity реши напълно да се откаже от рекламата, вярвайки, че тя подкопава доверието на потребителите.

След като рекламите се появят в резултатите от търсенето, потребителите неизбежно започват да се питат дали резултатите са истински или съдържат скрито търговско влияние,

съобщи по-рано ръководството на Perplexity.

Пазарът вече реагира

За разработчиците и малкия бизнес промените в броенето и лимитите се превърнаха в сериозно предизвикателство. Цената за разработване на ИИ базирани програми се е увеличила поради необходимостта да се плаща за всеки токен и изчислителна мощност. Идеята, че изкуственият интелект бързо ще замени хората и ще намали радикално разходите на компаниите, започва да се сблъсква с реалността на разходите за изчисления. През 2026 г. няколко големи технологични компании открито заявиха, че съвременният генеративен изкуствен интелект в някои случаи е по-скъп от традиционните човешки работници. Проблемът стана особено остър след широкото разпространение на агентно-базираните системи като Claude Code на Anthropic, съобщава Axios.

Uber е в паника

Един от най-известните примери беше ситуацията в Uber. Компанията активно интегрира Claude Code и Cursor в работните процеси на своите инженери в края на 2025 г. До април 2026 г. Uber беше изчерпала напълно годишния си бюджет, отпуснат за ИИ-инструменти. Това беше съобщено както от индустриалните медии, така и от самите ръководители на компанията.

Според техническия директор на Uber Правийн Наг, компанията буквално „се е върнала към чертожната дъска“, след като разходите са излезли извън контрол. Основната причина не са самите лицензи, а моделът на плащане, базиран на токени и изчисления. Инженерите на Uber започнали да използват Claude Code толкова широко, че разходите на служител достигнали 500-2000 долара на месец. С приблизително 5000 инженери това се превърнало в десетки или дори стотици милиони долари потенциални годишни разходи.

Uber също така съобщи, че приблизително 95% от инженерите им вече редовно използват AI-инструменти, а приблизително 70% от кодовете вече се създават с помощта на генеративен изкуствен интелект. Това означава, че проблемът не е възникнал от повреда в технологията, а по-скоро от прекомерната ѝ употреба. Claude Code се оказа толкова полезен, че компанията просто не можеше финансово да контролира мащаба на използването ѝ, според Briefs Finance.

Но няма резултати

На този фон, изявлението на президента и главен оперативен директор на Uber Андрю Макдоналд беше особено резонансно. Той директно заяви, че компанията „все по-трудно оправдава“ разходите си за изкуствен интелект. Той твърди, че няма ясна връзка между огромните разходи за токени и реалните подобрения на продуктите за потребителите. С други думи, компанията харчи повече пари, но не може директно да докаже, че постига пропорционални бизнес резултати, отбелязва The Verge.

Nvidia също не мълчи

В същото време подобни сигнали започнаха да се появяват и от Nvidia. Вицепрезидентът на компанията по Applied Deep Learning, Брайън Катандзаро, заяви, че за неговия екип „цената на изчисленията значително надвишава цената на труда“. Това е едно от първите подобни директни изявления от голям играч на пазара, че съвременният изкуствен интелект вече не изглежда да е евтина алтернатива на човешкия, припомня Tom’s Hardware .

И така, какво ни очаква по-нататък?

Изследователи и икономисти започват да твърдят, че пълната автоматизация може да не е икономически осъществима. Неотдавнашен академичен труд, озаглавен „Economics of Human and AI Collaboration“, заключава, че частичната автоматизация често е по-евтина и по-ефективна от пълната замяна на хората с изкуствен интелект. Колкото по-висока точност и надеждност изисква един бизнес, толкова по-скъпо става използването на ИИ системите.

В Reddit и в професионалните общности ситуацията вече се нарича „криза на токените“. Потребителите отбелязват, че големите компании са започнали да осъзнават, че генеративният изкуствен интелект не е евтин софтуер като SaaS услуга с фиксирана цена, а по-скоро постоянен поток от разходи за изчисления. И докато служителите имат стабилна заплата, разходите за изкуствен интелект могат да излязат извън контрол в зависимост от употребата.

Бъдещето на индустрията изглежда се крие в хибридните модели: използване на локални изчисления на устройства с чипове като Apple Silicon за простите задачи и използване на мощни облачни API само за сложните проблеми.

Ерата на неограничения и безплатен достъп до машинен интелект обаче е нещо от миналото, отстъпвайки място на строги икономически изчисления и борбата за всеки ватчас енергия.

Прегледи	55
Коментари	0
Добавена на	31 Май 2026
Източник	Kaldata