Послідовне навчання: зміна парадигми рекомендацій щодо персоналізованих оголошень

AI відіграє фундаментальну роль у створенні цінних зв’язків між людьми та рекламодавцями в сімействі додатків Meta. Механізм рекомендацій оголошень Meta на базі Рекомендаційні моделі глибокого навчання (DLRM)відіграв важливу роль у наданні персоналізованої реклами людям. Ключем до цього успіху було включення тисяч сигналів або функцій, розроблених людиною, у систему рекомендацій на основі DLRM.

Незважаючи на навчання на величезних обсягах даних, існують обмеження щодо поточних рекомендацій щодо оголошень на основі DLRM із розробкою функцій вручну через нездатність DLRM використовувати послідовну інформацію з даних досвіду людей. Щоб краще відобразити експериментальну поведінку, моделі рекомендацій щодо реклами зазнали фундаментальних трансформацій за двома вимірами:

Навчання на основі подій: вивчення уявлень безпосередньо з подій взаємодії та конверсії людини, а не традиційних функцій, розроблених людиною.
Навчання на основі послідовностей: розробка нових архітектур навчання послідовностей для заміни традиційних архітектур нейронних мереж DLRM.

Включаючи ці досягнення в області розуміння природної мови та комп’ютерного бачення, система рекомендацій щодо реклами наступного покоління від Meta усуває обмеження традиційних DLRM, що призводить до більш релевантної реклами для людей, вищої цінності для рекламодавців та кращої ефективності інфраструктури.

Ці інновації дозволили нашій рекламній системі глибше зрозуміти поведінку людей до та після переходу на рекламу, дозволяючи нам визначити наступний набір релевантних оголошень. З моменту запуску нова система рекомендацій щодо оголошень покращила точність прогнозування оголошень, що призвело до підвищення цінності для рекламодавців і збільшення конверсій на 2–4% у вибраних сегментах.

Обмеження DLRM для рекомендацій реклами

DLRM від Meta для персоналізованої реклами покладаються на широкий спектр сигналів, щоб зрозуміти наміри та вподобання людей щодо покупки. DLRM зробили революцію в навчанні рідкі рисиякі фіксують взаємодію людини на таких об’єктах, як сторінки Facebook, кількість яких часто обчислюється мільярдами. Успіх DLRM заснований на їхній здатності вивчати узагальнені, багатовимірні представлення, тобто вбудовування з розріджених функцій.

Щоб використовувати десятки тисяч таких функцій, використовуються різні стратегії для комбінування функцій, перетворення проміжних уявлень і формування кінцевих результатів. Далі сособливості розбору будуються шляхом агрегування атрибутів дій людини в різних часових вікнах з різними джерелами даних і схемами агрегації.

Деякі приклади застарілих розріджених функцій, створених таким чином:

Оголошення, які користувач натиснув за останні N днів → [Ad-id1, Ad-id2, Ad-id3, …, Ad-idN]
Сторінки у Facebook, які особа відвідала за останні M днів, із оцінкою кількості відвідувань на кожній сторінці → [(Page-id1, 45), (Page-id2, 30), (Page-id3, 8), …]

Створені людиною розріджені функції, як описано вище, були наріжним каменем для персоналізованих рекомендацій із DLRM протягом кількох років. Але цей підхід має обмеження:

Втрата послідовної інформації: інформація про послідовність, тобто порядок подій людини, може надати цінну інформацію для отримання кращих рекламних рекомендацій, що стосуються поведінки людини. Розріджені агрегації функцій втрачають послідовну інформацію в подорожах людини.
Втрата детальної інформації: дрібнозерниста інформація, як-от сумісне розміщення атрибутів в одній події, втрачається, оскільки функції агрегуються за подіями.
Довіра до людської інтуїції: людська інтуїція навряд чи розпізнає неінтуїтивні, складні взаємодії та закономірності з величезної кількості даних.
Резервний простір функцій: кілька варіантів функцій створюються за допомогою різних схем агрегації. Забезпечуючи додаткову цінність, агрегації, що перекриваються, збільшують витрати на обчислення та зберігання та роблять керування функціями громіздким.

Інтереси людей розвиваються з часом із безперервно змінюваними та динамічними намірами. Такі складності важко змоделювати за допомогою елементів ручної роботи. Моделювання цієї взаємодинаміки допомагає досягти глибшого розуміння поведінки людини з часом для кращих рекомендацій щодо реклами.

Зміна парадигми з вивченням послідовностей для систем рекомендацій

Нова система Meta для рекламних рекомендацій використовує навчання послідовності в своїй основі. Це спричинило необхідність повної переробки системи рекомендацій щодо реклами щодо сховища даних, форматів введення функцій та архітектури моделі. Редизайн вимагав створення нової інфраструктури, орієнтованої на людей, оптимізації навчання та обслуговування для найсучасніших архітектур послідовного навчання, а також коду моделі/системи для ефективного масштабування.

Функції на основі подій

Функції на основі подій (EBF) є будівельними блоками для нових моделей навчання послідовності. EBFs – оновлення традиційних функцій – стандартизує різнорідні вхідні дані для моделей навчання послідовності за трьома вимірами:

Потоки подій: потік даних для EBF, наприклад, послідовність останніх оголошень, з якими люди взаємодіяли, або послідовність сторінок, які людям сподобалися.
Довжина послідовності визначає, скільки останніх подій включено з кожного потоку, і визначається важливістю кожного потоку.
Інформація про подію: фіксує семантичну та контекстну інформацію про кожну подію в потоці, як-от категорію оголошень, з якими взаємодіяла особа, і позначку часу події.

Кожен EBF є єдиним узгодженим об’єктом, який фіксує всю ключову інформацію про подію. EBFs дозвольте нам включати багату інформацію та систематично масштабувати вхідні дані. Послідовності EBF замінюють застарілі розріджені функції як основні вхідні дані для моделей рекомендацій. У поєднанні з моделями подій, описаними нижче, EBF започаткували відхід від агрегацій функцій, розроблених людиною.

Моделювання послідовності з EBF

Модель подій синтезує вбудовування подій з атрибутів подій. Він вивчає вбудовування для кожного атрибута та використовує лінійне стиснення, щоб узагальнити їх у єдине вбудовування на основі атрибутів події. Події кодуються часовими мітками, щоб зафіксувати їх давність і часовий порядок. Модель подій поєднує кодування часових позначок із синтезованим вбудовуванням на основі атрибутів подій, щоб отримати остаточне представлення на рівні події, таким чином перетворюючи послідовність EBF у послідовність вбудовування подій.

Це схоже на те, як мовні моделі використовують вкладення для представлення слів. Різниця полягає в тому, що EBF мають словниковий запас, який на багато порядків перевищує словниковий запас природної мови, оскільки вони походять із різнорідних потоків подій і охоплюють мільйони об’єктів.

Вбудовані події з моделі подій потім подаються в модель послідовності в центрі системи рекомендацій оголошень наступного покоління. Модель послідовності подій — це модель узагальнення подій на рівні особи, яка використовує послідовні вбудовування подій. Він використовує найсучасніші механізми уваги до синтезувати вбудовування подій у попередньо визначену кількість вбудовувань, які визначаються оголошенням для рейтингу. За допомогою таких методів, як багатостороннє об’єднання уваги, складність модуля самоуважності зменшується О(N*N) до О(М*Н) . M — параметр, який можна налаштувати, а N — максимальна довжина послідовності подій.

Наступний малюнок ілюструє відмінності між DLRM із парадигмою функцій, створених людиною (ліворуч) і парадигмою моделювання послідовності з EBF (праворуч) з точки зору потоку подій людини.

Масштабування нової парадигми навчання послідовності

Після редизайну для переходу від навчання розріджених функцій до навчання послідовності на основі подій, наступним фокусом було масштабування між двома доменами — масштабування архітектури навчання послідовності та масштабування послідовностей подій, щоб вони були довшими та багатшими.

Архітектури навчання послідовності масштабування

Спеціалізована архітектура трансформатора, яка включає складні схеми кодування функцій для повного моделювання послідовної інформації, була розроблена для забезпечення швидшого вивчення та впровадження найсучасніших методів для систем рекомендацій. Головним завданням цього архітектурного підходу є досягнення вимог до продуктивності та ефективності виробництва. Запит до системи рекомендацій реклами Meta має ранжувати тисячі реклам за кілька сотень мілісекунд.

Щоб масштабувати навчання представлення для більш високої точності, існуючий підхід об’єднання сум було замінено з новою архітектурою, яка навчилася взаємодії функцій із вбудовування без пулу. У той час як попередня система, заснована на агрегованих функціях, була високо оптимізована для вставок фіксованої довжини, які об’єднуються за допомогою простих методів, таких як усереднення, навчання послідовності представляє нові проблеми, оскільки різні люди мають різну тривалість події. Довші послідовності подій змінної довжини, представлені нерівними тензорами вбудовування та необ’єднаними вбудовуваннями, призводять до більших витрат на обчислення та зв’язок із більшою дисперсією.

Ця проблема зростаючих витрат вирішується шляхом впровадження інновацій апаратного коду для підтримки зубчастих тензорів, а саме:

Власні можливості PyTorch для підтримки тензорів Jagged.
Оптимізація на рівні ядра для обробки тензорів Jagged на графічних процесорах.
А Jagged Flash Attention модуль для підтримки Flash Attention на тензорах Jagged.

Масштабування з довшими, багатшими послідовностями

Здатність системи рекомендацій наступного покоління Meta навчатися безпосередньо з послідовностей подій, щоб краще розуміти вподобання людей, додатково покращується завдяки довшим послідовностям і багатшим атрибутам подій.

Масштабування послідовності передбачає:

Масштабування з довшими послідовностями: Збільшення довжини послідовності дає глибше розуміння та контекст про інтереси людини. Для ефективного масштабування довжини послідовності використовуються такі методи, як багатоточне квантування та методи вибірки на основі значень.
Масштабування з більш багатою семантикою: EBF дають нам змогу фіксувати багатші семантичні сигнали про кожну подію, наприклад, за допомогою мультимодального вбудовування вмісту. Налаштовані методи векторного квантування використовуються для ефективного кодування атрибутів вбудовування кожної події. Це дає більш інформативне представлення остаточного вбудовування події.

Вплив і майбутнє навчання послідовності

Парадигма навчання послідовності подій була широко застосована в рекламних системах Meta, що призвело до підвищення релевантності та ефективності реклами, більш ефективної інфраструктури та прискореної швидкості дослідження. У поєднанні з нашим фокусом на передових трансформаторні архітектуринавчання послідовності подій змінило підхід Meta до систем рекомендацій реклами.

У майбутньому основна увага буде зосереджена на подальшому масштабуванні послідовностей подій у 100 разів, розробці більш ефективних архітектур моделювання послідовностей, таких як лінійні моделі уваги та простору станів, оптимізація кешу ключ-значення (KV) і мультимодальне збагачення послідовностей подій.

Подяки

Ми хотіли б подякувати Нірадж БхатіяZhirong Chen, Parshva Doshi, Джонатан Гербах, Юйсі ХуАбха Джайн, Кун Цзян, Сантану КолайБоян Лі, Хун Лі, Паоло Массімі, Сандіп Панді, Дінеш Рамасамі, Кетан СінгхДоріс Ван, Ренган Сю, Цзюньцзе Янг і вся команда вивчення послідовності подій, яка бере участь у розробці та виробництві системи рекомендацій щодо реклами на основі навчання послідовності наступного покоління.

Найпопулярніші категорії

(876) Соціальні Мережи

(731) Маркетинг Контенту

(650) Емейл Маркетинг

(808) Цифрова Реклама

Популярні новини

Новини | Католицький коннект

Працівники Ford сказали своєму генеральному директору, що «жоден...

Цифрове поле битви Ізраїлю: боротьба з дезінформацією ШІ

Реклама Чорної п’ятниці 2025 року: найкращі пропозиції від...