...
Цифрова Реклама

Новий інструмент штучного інтелекту Google використовує підказки із зображеннями замість тексту

Новий інструмент штучного інтелекту Google використовує підказки із зображеннями замість тексту



CNN

Найновіший інструмент штучного інтелекту від Google «Whisk» дозволяє людям завантажувати фотографії, щоб отримати комбіноване зображення, створене штучним інтелектом, навіть без того, щоб користувачі вводили будь-який текст, щоб пояснити, що вони хочуть.

Користувачі можуть вводити зображення, що відображають предмети, обстановку та стиль, перш ніж Whisk об’єднає все в одне зображення.

Whisk — це «креативний інструмент» для швидкого натхнення, як сказано в повідомленні в блозі Google, на відміну від «традиційного редактора зображень». По суті, Whisk призначений як весела функція AI, а не як щось, що має бути вишуканою професійною роботою.

Великі технологічні компанії, такі як Google і OpenAI, поспішають випускати споживчі продукти, які можуть продемонструвати застосування нової шикарної технології, хоча скептики попереджають, що відсутність огорожі для розвитку ШІ становить небезпеку для людства.

З того часу, як у 2021 році OpenAI запустив свій інструмент для створення тексту в зображення, Dall-E, концепція створених штучним інтелектом мистецтва заполонила соціальні мережі та стала центром споживчих товарів. Whisk від Google — це генератор зображення в зображення, створений на основі популярної концепції генераторів тексту в зображення.

Люди, які використовують Whisk, можуть «реміксувати» остаточне зображення, редагуючи свої вхідні дані та змішуючи категорії для створення різних зображень як плюшева іграшка, емальована булавка або наклейка. Користувачі можуть додавати текст якщо хочуть зрежисувати певні деталі, але це не обов’язково для створення образу.

«Whisk розроблений, щоб дозволити користувачам змінювати об’єкт, сцену та стиль новими та креативними способами, пропонуючи швидке візуальне дослідження замість ідеального редагування пікселів», — сказав Томас Ільїч, директор з управління продуктами в Google Labs, у заяві.

Whisk від Google побудований на основі генеративного штучного інтелекту, розробленого DeepMind, лабораторією ШІ, яку Google придбала в 2014 році.

Загальний вигляд офісів Google DeepMind після оголошення про те, що 9 жовтня 2024 року в Лондоні, Англія, засновник і генеральний директор Деміс Хассабіс і старший науковий співробітник Джон М. Джампер отримали Нобелівську премію з хімії 2024 року. Двоє співробітників Google DeepMind розділили Нобелівську премію з хімії 2024 року з Девідом Бейкером з Вашингтонського університету за відкриття, пов’язані зі структурою білків.

Whisk працює, використовуючи основну пропозицію штучного інтелекту Google, Gemini, яка дебютувала в грудні 2023 року, і поєднує її з Imagen 3, останнім генератором тексту в зображення, випущеним DeepMind у грудні.

Коли користувачі завантажують свої зображення, Gemini створює підпис, який передається в Imagen 3. Процес фіксує «сутність» об’єкта на відміну від точної копії, що дозволяє повторно міксувати остаточне зображення, але також означає, що кінцевий продукт може відхилятися від підказка.

Наприклад, згенероване зображення може мати інший зріст, зачіску або колір шкіри, ніж зображення підказок, повідомляє Google у блозі.

Коли в лютому Google вперше запустив програму для створення тексту в зображення Gemini, компанія спочатку зіткнулася з негативною реакцією, оскільки інструмент створював історично неточні зображення.

За словами компанії, Whisk спочатку доступний як веб-сайт у Google Labs для користувачів у США та знаходиться на ранніх стадіях розробки.

OpenAI також нещодавно випустила генератор тексту у відео під назвою Sora, підкреслюючи конкуренцію споживчих товарів.

Ден Айвз, керуючий директор і старший аналітик фондового ринку Wedbush Securities, сказав CNN, що Whisk — це ще один момент «напружити м’язи» для Google у гонці ШІ та технологій.

«DeepMind є ключовим активом для Google», — сказав Айвз, зазначивши, що продукти штучного інтелекту є частиною «скарбнички» нових продуктів Google на 2025 рік, які також включають нову операційну систему Android, створену у співпраці з Samsung і Qualcomm.

Alex

About Author

Recommend – дізнавайтеся більше про події, що формують наше сьогодення. Найцікавіші новини України та світу, аналітика, тренди та ексклюзивні матеріали – все це на recommend.com.ua!

Отримуйте останні оновлення та великі пропозиції