Google позволи на потребителите да се клонират за видеоклиповете
Google представи функция за създаване на лични аватари за своята ИИ услуга Flow на годишната си конференция за разработчици Google I/O. Елиас Роман, вицепрезидент на подразделението за експериментални продукти в Google Labs, демонстрира инструмента лично: потребителите вече могат да сканират собствения си външен вид, да създадат точно дигитално копие на себе си и да го вмъкнат във всеки генериран видеоклип. Според Роман, функцията е насочена към създателите на съдържание, които искат да бъдат в кадър, но не са готови да отделят време за реално заснемане.
Аватарите ще бъдат достъпни не само във Flow, но и в екосистемата на AI-асистентите Gemini, както и във видео платформата YouTube. Роман нарече пуснатия миналата година Flow първата продуктова линия на Google, предназначена изключително за творческа реализация за разлика от предишните инструменти на компанията, фокусирани върху програмирането, продуктивността или потреблението на съдържание.
Техническата основа на обновената услуга е нов модел за генериране на видео, Omni Flash, който замени невронната мрежа Veo. Моделът обогатява всеки кадър с детайли и решава ключов проблем на предишните версии на Flow – изкривяване на характеристиките на героите при генериране на множество последователни сцени. Успоредно с това, графичната невронна мрежа Nano Banana добавя по-дълбоко разбиране на контекста на реалния свят към процеса на създаване на изображение.
Процесът на създаване на аватар изглежда така: потребителят влиза в настройките на Flow акаунта, сканира QR-кода със смартфон, след което системата иска да запише кратко видео, на което да се произнесе на глас поредица от числа и да се завърти главата, за да заснеме лицето от всички ъгли. Механиката разпознаваемо копира подобна функция на приложението Sora от OpenAI, което беше позиционирано като първата социална мрежа с изкуствен интелект, но спря да работи по-малко от седем месеца след старта си. Google въведе строго ограничение: разрешено е да се генерира само собствено дигитално копие, но не и копия на други хора. Всички видеоклипове с аватари автоматично получават невидим цифров воден знак SynthID.
По време на презентацията Роман показа забавно видео, в което неговият реалистичен дигитален двойник с точно възпроизвеждане на гласа прави забележки на екипа на Flow на фона на кофа за боклук. Точно в интерфейса на Flow, използвайки текстови команди, той променя фона на видеото и цвета на ризата на аватара си в реално време, докато Omni Flash мигновено възстановява сцената, запазвайки външния вид на героя.
Това не е първият опит на Google с инструменти за дийпфейкове: месец по-рано в YouTube Shorts се появи ограничена функция за създаване на ИИ аватари. Конкурентите също разработват подобни технологии и по-специално Meta миналата година представи AI-преводач за видеоклипове в Instagram Reels, който не само променя езика на гласа зад кадър, но и настройва изражението на лицето на говорещия спрямо изговорените думи.
За създателите на съдържание новите инструменти означават радикално опростяване на създаването. В същото време генеративният изкуствен интелект все повече разделя аудиторията: някои зрители възприемат подобно съдържание като фалшиво и неестествено, особено ако дори са способни да разпознаят на пръв поглед, че са изправени пред дигитален клонинг, а не пред жив човек.