Anthropic представи AI модела Claude Opus 4.8, който не се опитва да скрие некомпетентността си по въпроси, които не разбира
Anthropic представи Opus 4.8, най-новата версия на своя усъвършенстван публичен модел. Заедно с нея разработчиците въведоха Dynamic Workflows (Динамични работни потоци) – функция, която ще позволи на Opus и другите модели да управляват сложни задачи, разпределени между стотици паралелни под-агенти. За това съобщава TechCrunch.
Opus 4.8 се появи 41 дни след пускането на Opus 4.7, което е значително по-бързо от обичайния цикъл на актуализация на Anthropic (предишните версии Sonnet и Haiku бяха съответно с интервал от три и седем месеца). Счита се, че ускореното пускане на пазара се дължи на слабия прием на Opus 4.7, който за някои потребители беше разочароващ. През същия период конкурентите в лицето на OpenAI с нейния модел Codex и Google с Gemini Flash също представиха значителни актуализации, което увеличи натиска върху Anthropic.
Ключовото подобрение в Opus 4.8 е обработката на некоректни или неопределени данни. Първите тестери установиха, че новият модел е „по-склонен да съобщава за несигурност в работата си и по-малко склонен да прави необосновани твърдения“. Ефективността на модела беше потвърдена и от инвестиционната компания Bridgewater Associates. Според представителите основната разлика на актуализираната версия е, че невронната мрежа активно посочва проблемите във входните и изходните данни, които другите алгоритми обикновено не забелязват, принуждавайки потребителите сами да търсят грешките.
Заедно с новия модел Anthropic пусна Dynamic Workflows във формат за предварителен преглед на изследванията. Системата е проектирана така, че да позволява на големи модели (като Opus) да управляват сложни задачи в стотици паралелни под-агенти. Както обяснява компанията, с това нововъведение пакетът Claude Code и моделът Opus 4.8 ще могат да „мигрират стотици хиляди редове код от етапа на стартиране до обединяването, разчитайки на съществуващия набор от тестове като ограничение“.
В същото време разработчиците продължават да се подготвят за цялостното стартиране на модела Mythos, чийто ранен достъп миналия месец породи опасения за използването му от киберпрестъпници. Anthropic подчерта, че активно се занимава с проблемите, свързани със сигурността на Mythos, и очаква да пусне моделите от клас Mythos за всички клиенти през следващите няколко седмици.