Швидкі посилання
- Короткий огляд стабільної дифузії: отримання хороших зображень
- Написання детального опису
Ключові висновки
- Розділіть підказки за категоріями, як-от предмет, освітлення, художній стиль, художник і спільнота.
- Використовуйте негативні підказки, щоб покращити зображення: додайте такі слова, як «потворний», щоб уникнути певних елементів.
- Налаштуйте вагу ключових слів у підказці, додавши дужки, щоб підкреслити слова.
Stable Diffusion може вивести генерацію зображень штучним інтелектом на наступний рівень із великою кількістю детальних налаштувань для вивчення, але це також означає, що отримати хороші результати не зовсім інтуїтивно зрозуміло. Однак розуміння лише кількох ключових технік допоможе вам подолати цю перешкоду.
Короткий огляд стабільної дифузії: отримання хороших зображень
Існує багато генераторів зображень штучного інтелекту, і Stable Diffusion є одним з найпопулярніших завдяки своїй природі з відкритим кодом і розширеному контролю над створенням зображень.
Але це також означає, що може бути важко одразу отримати гарні зображення. Я провів багато часу, використовуючи генератор штучного інтелекту Midjourney, який створює естетично привабливі зображення майже без зусиль. Для порівняння, для вивчення Stable Diffusion потрібно трохи більше зусиль.
Найшвидший спосіб отримати хороші результати — це написати детальний опис, додати негативну підказку, щоб уникнути небажаних елементів, а потім уточнити зображення, змінивши вагу для ключових слів та ідей у вашій підказці.
Опануйте ці основи, і ви будете впевнені, що зможете щоразу створювати справді чудові зображення.
Написання детального опису
Почнемо з опису. За допомогою Stable Diffusion вам потрібно написати детальні підказки, якщо ви хочете створити приголомшливі зображення. Вивчення підказок інших людей — це фантастичний спосіб побачити, як це робиться.
Ми використаємо відео вище як приклад. Підказка виглядає так:
Portrait of a cosmic goddess, suit made out of stars and galaxies and cosmic energy, intricate, headshot, highly detailed, digital painting, artstation, concept art, sharp focus, cinematic lighting, illustration, art by argerm and greg rutkewski, alphonese much, cgsociety
Ця підказка складається з 38 слів, що дає вам гарне уявлення про те, як далеко вам потрібно просунути свій опис. На щастя, не надто складно зрозуміти, який тип слів використовується в цьому прикладі. Я швидко проаналізував цю підказку та виявив, що є сім категорій, на які можна розділити ключові слова.
- Тема: портрет космічної богині, костюм із зірок і галактик і космічної енергії
- Постріл: Постріл у голову
- Освітлення: Кінематографічне освітлення
- Деталь: Складний, високодеталізований, чіткий фокус
- Художній стиль: цифровий живопис, концепт-арт, ілюстрація
- Художник: Мистецтво Аргерма та Грега Руткєвскі, Альфонса Мухи
- Посилання спільноти: ArtStation, CGsociety
Використання шаблону підказки може дуже допомогти при виробленні початкової ідеї. Ось той, який використовує автор відео:
Предмет, дія, фон, освітлення, стиль, художник
Немає жорсткого правила щодо того, які ключові слова слід включити або в якому порядку, за винятком того, що слова на початку підказки мають більшу важливість і будуть виднішими на зображенні.
Ось ще один шаблон, з яким ви можете поекспериментувати:
- Тема: наприклад, жінка, чоловік, кентавр
- Поза: наприклад, стоячи, сидячи, дивлячись у вікно, спати
- Подробиці: наприклад, одяг, колір волосся, аксесуари, реквізит
- Навколишнє середовище: наприклад офіс, пляж, ліс, середньовічний замок
- Дескриптори якості: дрібні деталі, складні
З часом ви можете зупинитися на шаблоні, який принесе вам найкращі результати. Однак до того часу ви можете використовувати ці шаблони, щоб розпочати роботу.
Використання негативних підказок
Негативні підказки — це інструмент, який можна використовувати для покращення ваших зображень, повідомляючи системі AI, що ви не хочете бачити. Якщо на вашому зображенні є випадкові люди, ви можете написати «немає людей» у негативному запиті, щоб спробувати їх видалити.
Спочатку це може здатися магічним рішенням, але це не зовсім так. Іноді додавання всього лише одного зайвого слова до негативної підказки раптово і кардинально змінить ваш імідж так, як ви не очікували.
Зв’язок між негативною підказкою та зображенням часто важко зрозуміти. Здається, немає універсальних негативних підказок, які б спрацьовували щоразу. Однак є деякі загальнопопулярні слова, які спільнота Stable Diffusion почала використовувати.
Цей користувач YouTube пропонує вам спробувати наступний негативний шаблон підказки:
kitsch, ugly, oversaturated, grain, low-res, blurry, bad anatomy, poorly drawn face, extra limb, poorly drawn hands, missing limb, floating limbs, disconnected limbs, malformed hands, blur, out of focus, long neck, long body, ugly, poorly drawn, childish, mangled, old, surreal
В іншому цікавому випадку цей користувач Reddit пояснює, як і чому вони використовують таке негативне підказка:
Карикатура, боді-хоррор, мутант, facebook, youtube, їжа
Перші три мають бути очевидними, чому я не хочу, щоб вони впливали на мої фотографії звичайних людей. Останні три є спробою відфільтрувати значну частину хмари тегів пошукової оптимізації (seo), яка забруднює багато зображень у наборі даних.
Спробуйте деякі з цих негативних тегів, щоб побачити, як вони впливають на ваші зображення. Корисно почати з малого, лише з кількох слів у негативній підказці, щоб ви могли побачити, як слова впливають на зображення.
Уточнення ваших результатів
Коли ви навчитеся писати детальні підказки для зображень і використовувати інструмент негативних підказок для видалення небажаних елементів із зображення, найкраще навчитися «зважувати» певні слова, щоб підкреслити частини вашого зображення.
Ви можете зробити це, додавши дужки до будь-якого слова в підказці, на якому ви хочете зосередити увагу системи ШІ, відносно інших слів у вашому описі. Наприклад, якщо ви хочете підкреслити «банан», ви можете написати таку підказку: миска з фруктами, (банани), яблука, полуниця.
У цьому відео ви можете побачити кілька прикладів того, що відбувається із зображенням, коли вага наноситься на різні фрукти в описі. Додавання дужок до слова підвищить важливість цього елемента у вашому зображенні. Ви можете додати кілька кронштейнів, щоб збільшити вагу.
Ви також можете виділити слово та натиснути Ctrl або Командаплюс вгору або вниз стрілка, щоб змінити вагу. Якщо ви використовуєте цей ярлик, він також додасть значення біля слова.
За замовчуванням кожне ключове слово у вашій підказці матиме вагу 1. Ви можете використовувати це як відправну точку для збільшення або зменшення ваги. Наприклад, вага 2 або 3 дасть надзвичайні результати, тому краще рухатися з невеликими кроками, як-от 1,2 або 1,3 тощо. Гра з вагою слів є одним із найпростіших способів продовжити створення свого зображення.
Почати з чіткого опису з великою кількістю деталей, а потім перейти до негативних підказок і зважування ключових слів – це одні з найкращих основ для вивчення Stable Diffusion. Пам’ятаючи про ці моменти, ви зможете створювати саме ті зображення, які хочете.