ByteDance, създателят на TikTok, представи актуализираната серия AI модели под бранда Volcano Engine. Основната иновация е Doubao 2.1 Pro, който според компанията превъзхожда Claude Opus 4.6 по редица показатели на цена, по-ниска с почти 80%. Анонсиран бе и видеомоделът Seedance 2.5 с възможност за генериране на клипове до 30 секунди и инструменти за работа с изображения и звук.
Doubao 2.1 Pro е получил подобрения в няколко области: програмиране, AI агенти и анализ на визуална информация. Моделът постигна високи резултати в тестовете Terminal Bench 2.1, SWE-Pro и SciCode за задачи за генериране и анализ на програмен код и зае челни позиции в тестовете OSWorld, MobileWorld и MMMU-Pro, оценяващи автономните агенти и мултимодалните системи. Компанията изтъква, че Doubao 2.1 Pro превъзхожда Claude Opus 4.6 по редица показатели.
ByteDance посочва цената като едно от основните предимства на новия модел. Използването на Doubao 2.1 Pro струва 6 юана (~0,83 долара) на милион входни лексеми и 30 юана (~4,14 долара) на милион изходни лексеми, а обработката на кеширани данни струва 1,2 юана. Разработчиците изчислиха, че общата цена на притежание на модела е с близо 80% по-ниска от тази на Claude Opus 4.6. За приложения с голям брой заявки компанията предлага и версията Turbo с още по-ниска цена.
Интересът към фамилията модели Doubao продължава да расте: към юни дневният обем на обработка на токени надхвърля 180 трилиона – над десет пъти повече, отколкото година по-рано. По данни на IDC Volcano Engine държи 49,5% от китайския пазар на публични облачни услуги MaaS (Model as a Service), които осигуряват достъп до AI моделите чрез облачна инфраструктура.
ByteDance също така развива бизнеса си с генеративно видео. Новият модел Seedance 2.5 може да създава клипове с продължителност до 30 секунди с една заявка и да работи едновременно с 50 мултимодални елемента.
Моделът е снабден с локални инструменти за редактиране, които позволяват да се променят отделни части на видеото, без да се губи визуалната цялост между кадрите. Компанията вече използва предишни версии на Seedance в електронната търговия, промишлеността и за сливане на данни в системите за автономно шофиране.
В допълнение към видеото ByteDance представи нови инструменти за работа с изображения и звук. Seedream 5.0 Pro се сдоби с функции за генериране на изображения с интерактивно редактиране и разделяне на многослойни обекти, а Seed-Audio 1.0 се научи как да създава аудиосцени с множество герои, фонова музика и звукови ефекти без предварително обучение за конкретната задача.
Компанията също така разшири своята екосистема Volcano Engine за корпоративни приложения с изкуствен интелект. ByteDance пусна Ark CLI за бързо разгръщане на агенти, актуализира платформите AgentKit и HiAgent до версия 3.0 и представи ArkClaw – работно пространство за агенти с изкуствен интелект от корпоративен клас. Платформата Volcano Ark се използва от повече от 1,1 милиона компании и разработчици, а около 200 организации вече са надхвърлили границата от 1 трилион токена годишен достъп.