Google разкри тайната на висококачествените AI-изображения: как да пишем правилно заявките
Качеството на изображенията, генерирани от изкуствен интелект, често зависи не само от самия модел, но и от това как е формулирана заявката. Google публикува насоки, които ще помогнат за постигане на по-точни и реалистични резултати.
Google публикува нови насоки за писане на ефективни текстови заявки за генериране на изображения с помощта на изкуствен интелект. Препоръките са предназначени предимно за новия модел Gemini Omni, но повечето от съветите са еднакво полезни и за останалите популярни ИИ системи, които работят с изображения и видео, според Socialmediatoday.
Какви подробности трябва да бъдат включени в заявките към ИИ?Google наскоро представи Gemini Omni, който е най-съвременният модел на компанията за създаване на визуално съдържание. Инструментът може да генерира реалистични изображения и видеоклипове въз основа на текстови описания и поддържа разширени функции за редактиране.
Компанията отбелязва, че основната причина за лошите резултати често са недостатъчно подробните или неясни потребителски заявки. Ето защо Google реши да обясни кои елементи от описанието имат най-голямо влияние върху крайния резултат.
Започнете с описание на ракурса и композициятаЕдин от най-важните параметри е начинът, по който е построен кадърът. Google препоръчва да посочите типа на кадъра: голям, среден или широк.
За видеоклиповете е важно да се опише и движението на камерата. Например, дали камерата трябва плавно да се приближава към обекта, да се движи странично или да създава ефект на летене над пейзажа. Такива уточнения помагат на системата да разбере по-добре намерението на автора и да създаде подходяща композиция.
Google отбелязва, че съвременните модели разбират добре естествения език, така че потребителите трябва да бъдат възможно най-конкретни, когато описват желания резултат. Вместо общи твърдения, е по-добре да се уточни дали изображението трябва да изглежда реалистично, кинематографично, карикатурно или футуристично.
Колкото по-точно е описан стилът, толкова по-близо до очаквания ще бъде резултатът.
Например, заявката „футуристичен град в стил научна фантастика с неоново осветление“ ще върне значително по-добри резултати от просто „град на бъдещето“.
Осветлението помага за създаването на атмосфераGoogle също препоръчва да се обърне внимание на осветлението на сцената. Заявката ви трябва да включва не само източника на светлина, но и естеството на осветлението. Това може да бъде слънчева светлина, улична лампа, залез или рекламни табели. Полезно е също така да опишете цялостното настроение на сцената, например дали трябва да се усеща уютно, мистериозно, напрегнато или драматично.
Осветлението често определя емоционалното въздействие на завършеното изображение. Детайлите на местоположението правят сцената по-завладяваща. Според експертите на Google, много потребители описват обстановката твърде повърхностно.
Ако сцената се развива в гора, е важно да се отбележи видът дърветата, характеристиките на терена, наличието на скали, водни басейни или други елементи на ландшафта. Ако сцената се развива в град, е полезно да се уточни архитектурата, уличните условия или естеството на сградите. Такива детайли позволяват на изкуствения интелект да пресъздаде по-точно замислената сцена.
Не забравяйте за действието и взаимодействието на обектитеGoogle препоръчва да се обърне специално внимание на описанието на случващото се в кадъра. Важно е в заявката да се включи кой точно присъства, какво правят героите и как взаимодействат помежду си или с околната среда. Например, вместо кратката заявка „рицар на кон“, е по-добре да се напише: „рицар в сребърна броня препуска през поле по време на гръмотевична буря, докато конят вдига пръски от локвите“.
Колкото повече ясни подробности съдържа описанието на дадено действие, толкова по-точно моделът ще може да възпроизведе замисленото намерение. Въпреки че тези насоки са разработени за Gemini Omni, те всъщност отразяват общите принципи на работа на повечето съвременни генератори на изображения и видео.
Всички популярни ИИ модели се представят по-добре, когато им се даде ясно описание на композицията, стила, осветлението, местоположението и действията на героите. Следователно, новото ръководство на Google може да бъде полезно не само за потребителите на Gemini, но и за тези, които работят с други инструменти за генеративен изкуствен интелект.