Багатоагентні системи стають критичною розробкою штучного інтелекту завдяки їх здатності координувати кілька великих мовних моделей (LLMS) для вирішення складних проблем. Замість того, щоб покладатися на перспективу однієї моделі, ці системи розповсюджують ролі між агентами, кожен з яких сприяє унікальній функції. Цей поділ праці підвищує здатність системи аналізувати, реагувати та діяти більш надійними способами. Незалежно від того, чи застосовується до налагодження коду, аналіз даних, покоління, що здійснює введення, або інтерактивне прийняття рішень, агенти, керовані LLM, досягають результатів, які одиночні моделі не можуть послідовно відповідати. Потужність цих систем полягає в їх дизайні, зокрема в конфігурації між агентських з'єднань, відомих як топології, та конкретні інструкції, що надаються кожному агенту, називаються підказками. У міру дозрівання цієї моделі обчислення завдання перейшло від доведення доцільності до оптимізації архітектури та поведінки для вищих результатів.
Одна суттєва проблема полягає у складності ефективного проектування цих систем. Коли підказки, ті структуровані входи, які керують роллю кожного агента, дещо змінені, продуктивність може різко розгойдуватися. Ця чутливість робить масштабованість ризикованою, особливо коли агенти пов'язані між собою в робочих процесах, де вихідний вихід служить введенням іншого. Помилки можуть поширюватися або навіть посилювати. Більше того, топологічні рішення, такі як визначення кількості залучених агентів, їх стиль взаємодії та послідовність завдань, все ще сильно залежать від ручної конфігурації та випробувань та помилок. Простір дизайну величезний і нелінійний, оскільки він поєднує численні варіанти як для оперативної інженерії, так і для будівництва топології. Оптимізація обох одночасно була значною мірою недосяжною для традиційних методів проектування.
Було докладено декількох зусиль для вдосконалення різних аспектів цієї дизайнерської проблеми, але прогалини залишаються. Такі методи, як DSPY Automate Exemplar Generation для підказок, а інші зосереджуються на збільшенні кількості агентів, які беруть участь у таких завданнях, як голосування. Такі інструменти, як ADAS, вводять топологічні конфігурації на основі коду через мета-агенти. Деякі рамки, такі як Афлоу, застосовують такі методи, як пошук дерев Монте -Карло, щоб ефективніше досліджувати комбінації. Тим не менш, ці рішення, як правило, зосереджуються на оперативній або топологічній оптимізації, а не на обох. Ця відсутність інтеграції обмежує їх здатність генерувати дизайни MAS, які є і розумними та надійними в складних оперативних умовах.
Дослідники Google та Кембриджський університет представили нову рамку на ім'я Багатоагентний пошук системи (маса). Цей метод автоматизує дизайн MAS шляхом переплетення оптимізації як підказок, так і топологій у поетапному підході. На відміну від попередніх спроб, які трактують два компоненти незалежно, маса починається з визначення того, які елементи, як підказки, так і топологічні структури, найімовірніше впливатимуть на продуктивність. Звушуючи пошук цього впливового підпростору, рамки працюють більш ефективно, забезпечуючи результати більш високої якості. Метод прогресує на трьох етапах: локалізована оптимізація підказки, вибір ефективних топологій робочого процесу на основі оптимізованих підказок, а потім глобальної оптимізації підказок на загальнонаціональному рівні. Рамка не тільки зменшує обчислювальні накладні витрати, але й знімає тягар ручної настройки від дослідників.
Технічна реалізація маси структурована та методична. По -перше, кожен будівельний блок MAS зазнає оперативного вдосконалення. Ці блоки є модулями агента з конкретними обов'язками, такими як агрегація, роздуми чи дискусія. Наприклад, оперативні оптимізатори генерують варіації, що включають як інструктивні вказівки (наприклад, “подумайте поетапно”), і на прикладі навчання (наприклад, демонстраційні або кілька пострілів). Оптимізатор оцінює їх, використовуючи валідаційну метрику для керівництва удосконаленнями. Після того, як підказка кожного агента буде оптимізована локально, система продовжує вивчати дійсні комбінації агентів для формування топологій. Ця оптимізація топології інформується за попередніми результатами та обмежується обрізаним пошуковим простором, визначеним як найбільш впливовим. Нарешті, найкраща топологія зазнає оперативної настройки глобального рівня, де інструкції тонко налаштовані в контексті всього робочого процесу, щоб максимально збільшити колективну ефективність.
У таких завданнях, як міркування, багатогранне розуміння та генерація коду, оптимізований MAS послідовно перевершує існуючі орієнтири. У тестуванні на продуктивність за допомогою набору даних MATAL Gemini 1.5 Pro на математичному наборі даних, оператизовані оптимізовані агенти показали середню точність близько 84% із посиленими методами спонукання, порівняно з 76–80% для агентів, що масштабуються за допомогою самоконстенції або багатоагентної дискусії. На орієнтирі Hotpotqa, використовуючи топологію дебатів у масовому рівні, призвело до покращення на 3%. На відміну від цього, інші топології, такі як відображення або узагальнення, не змогли отримати прибутки або навіть призвели до деградації 15%. На LiveCodeBench топологія виконавців забезпечила +6% підвищення, але такі методи, як рефлексія, знову побачили негативні результати. Ці висновки підтверджують, що лише частка топологічного дизайнерського простору позитивно сприяє та посилює потребу в цілеспрямованій оптимізації, наприклад, що використовується в масі.
Кілька ключових видів досліджень включають:
- Складність дизайну MAS суттєво впливає на швидку чутливість та топологічне розташування.
- Оптимізація оперативної оптимізації, як на блок, так і на системному рівні, є більш ефективною, ніж масштабування агента, про що свідчить 84% точність з підвищеними підказками проти 76% при масштабуванні самостійності.
- Не всі топології корисні; Дебати додали +3% у HotPotqa, тоді як роздуми спричинило падіння до -15%.
- Масова рамка інтегрує оптимізацію оперативної та топології в три фази, різко зменшуючи обчислювальний та дизайнерський навантаження.
- Топології, такі як дискусія та виконавець, ефективні, а інші, такі як відображення та узагальнення, можуть погіршити продуктивність системи.
- Маса уникає повної складності пошуку, обрізаючи проектний простір на основі аналізу раннього впливу, вдосконалення продуктивності, зберігаючи ресурси.
- Підхід є модульним і підтримує конфігурації агента підключення та гри, що робить його пристосованим до різних доменів та завдань.
- Заключні моделі MAS від масового перевищення найсучасніших базових ліній через декілька орієнтирів, таких як Math, HotPotqa та LiveCodeBench.
На закінчення, це дослідження визначає швидку чутливість та складність топології як основні вузькі місця в розвитку багатоагентної системи (MAS) та пропонує структуроване рішення, яке стратегічно оптимізує обидві області. Масова рамка демонструє масштабований, ефективний підхід до дизайну MAS, мінімізуючи потребу в введенні людини, одночасно максимізуючи продуктивність. Дослідження представляє переконливі докази того, що краща оперативна конструкція є більш ефективною, ніж просто додавання агентів, і що націлений на пошук у підмножинах впливової топології призводить до значущих прибутків у реальних завданнях.
Перевірте папір. Весь кредит на це дослідження стосується дослідників цього проекту. Також сміливо слідкуйте за нами Твіттер І не забудьте приєднатися до нашого 95 к+ мл subreddit і підписатися на Наш бюлетень.
ASIF Razzaq – генеральний директор MarktechPost Media Inc .. Як візіонерський підприємець та інженер, ASIF прагне використовувати потенціал штучного інтелекту для соціального блага. Його останнє зусилля-це запуск медіа-платформи штучного інтелекту, Marktechpost, яка виділяється своїм поглибленим висвітленням машинного навчання та глибоких новин про навчання, які є технічно обгрунтованими та легко зрозумілими широкою аудиторією. Платформа може похвалитися понад 2 мільйонами щомісячних поглядів, що ілюструє її популярність серед аудиторій.