Революция в ИИ: Новият модел на Alibaba работи 35 часа без човешка намеса и разгроми Claude и DeepSeek
Китайската корпорация Alibaba представи своя флагмански модел за изкуствен интелект Qwen3.7-Max. Новият продукт представлява универсална платформа за ИИ-агенти: той е способен да изпълнява сложни инженерни и офисни задачи в продължение на часове без човешка намеса, самостоятелно да коригирагрешките и да запазва контекста. В тестовете моделът надмина аналозите си от Anthropic и DeepSeek. За разлика от предишните версии на Qwen, новият модел няма отворени тегла и е достъпен само чрез платения API на Alibaba Cloud.
Alibaba твърди, че Qwen3.7-Max е изпълнявала инженерна задача без прекъсване в продължение на 35 часа. По време на теста ИИ получи достъп до сървъра с непозната за него хардуерна архитектура T-Head ZW-M890 PPU и трябваше да оптимизира изчислителното ядро. За това време моделът изпълни 1158 извиквания на средства, проведе 432 изчисления, самостоятелно коригираше грешките и постепенно подобряваше кода. В резултат производителността на системата се увеличи приблизително десет пъти.
Разработчиците отбелязват, че един от основните проблеми на езиковите модели е загубата на логика и контекст при продължителна работа. Обикновено ИИ започва да забравя инструкциите, да допуска грешки или да „зацикля“. Qwen3.7-Max е създаден именно за решаване на този проблем.
В Alibaba наричат модела „универсална агентска платформа“, способна да поддържа сложни разсъждения и стабилна работа в продължение на хиляди последователни стъпки.
За обучението на новия модел компанията използва подхода „мащабиране на средата“. Вместо просто да увеличават обема на текстовите данни, разработчиците са създали множество разнообразни сценарии, в които ИИ се е учил да взема решения, да работи с различни инструменти и да се адаптира към нови условия. Например, в теста YC-Bench моделът е преминал симулация на годишния жизнен цикъл на стартъп: наемал е служители, анализирал е договори, избирал е клиенти и е управлявал ресурси. В хода на тази симулация ИИ успя да генерира виртуални приходи в размер на 2,08 млн. долара — почти два пъти повече от предишната версия Qwen3.6-Plus.
От бизнес гледна точка Qwen3.7-Max се позиционира като универсален инструмент за разработка на софтуер, автоматизация на офисни задачи и инженерни дейности. Моделът поддържа контекст до 1 млн. токена и максимален лимит на изходните данни от 64 хил., което му позволява да обработва големи обеми код и документация. Той е способен автоматично да форматира документи, да редактира отчети, да оформля научни работи според стандартите, да създава таблици, презентации и визуализации. При това системата е съвместима с популярни агентни платформи и инструменти за разработчици, включително Claude Code и OpenClaw, работещи чрез API на Anthropic и MCP-протоколи.
В тестовете на Alibaba новият модел показа високи резултати по математика, програмиране и логически задачи. В редица бенчмаркове Qwen3.7-Max надмина Claude Opus-4.6 Max и DeepSeek V4-Pro Max.
При това Alibaba се постара да направи използването на модела по-евтино от западните аналози. Цената на API е 2,5 долара за милион входни токена и 7,5 долара за милион изходни токена, или общо 10 долара. За сравнение, използването на GPT-5.4 от OpenAI струва 17,5 долара за милион токена, а на Claude Opus 4.7 от Anthropic — 30 долара.
Предишните версии на Qwen бяха публикувани с отворени тегла и се използваха активно от общността на разработчиците на локални ИИ системи. Qwen3.7-Max обаче е достъпна само чрез облачната инфраструктура на Alibaba Cloud. Това предизвика смесена реакция: експертите високо оцениха техническото ниво на модела и способността му за продължителна автономна работа, но много разработчици бяха разочаровани от затворения формат. Qwen3.7-Max се превърна в поредния признак, че индустрията окончателно е навлезела в „ерата на агентите“.