...
Аналітика та Дані

Microsoft пропонує “аналоговий оптичний комп'ютер” на 100-кратне збільшення енергоефективності AI, що виходите, дослідження, опубліковані в природі

Штучний інтелект (AI) та комбінаторна оптимізація сприяють швидкому розвитку наукових досліджень та промислових застосувань. Однак їх збільшення споживання енергії також викликає серйозну проблему для стійкості цифрових обчислень.

Тим часом, Більшість сучасних нових обчислювальних систем або хороші в AI, або лише хороші в оптимізації. Більше того, вони часто потребують частого енергетичного споживання цифрових перетворень, що обмежує їх ефективність. Крім того, у практичних додатках ці системи часто мати труднощі ефективно співпрацювати з обладнанням. Вони погано виконують, чи то боротьба з нейронними мережами з обмеженою пам’яттю, вирішенням складних проблем оптимізації або подолання з аналоговим обчислювальним шумом.

Що робити, якщо ми змінимо своє мислення і використовуємо світло та аналогові сигнали для обчислення, а не покладатися на перемикання між “0” та “1”? Чи може цей метод обчислень, який не потребує частих перетворень і не покладається на цифрову логіку, порушити існуючі обмеження?

На основі цього, Команда з Microsoft Research Cambridge, Великобританія, та його співробітники запропонували “аналоговий оптичний комп'ютер” (AOC). Без цифрового перетворення він може Ефективно виконувати як завдання AI, так і комбінаторної оптимізації Одночасно і має значні переваги розширення та енергоефективні переваги.

Відповідна дослідницька робота була опублікована в авторитетному науковому журналі Nature. Jiaqi Chu, випускник університету Шанхаю Цзяо Тонг та головний дослідник Microsoft Research Cambridge, Великобританія, є одним із авторів статті.

Паперове посилання: https://www.nature.com/articles/S41586-025-09430-Z

Повідомляється, що AOC поєднує Аналогова електронна технологія з трьома розмірними оптичними технологіями, що дозволяє одній і тій же платформі одночасно прискорити як висновки AI, так і комбінаторні оптимізації. Ця “подвійна можливість домену” виграє від швидкого методу пошуку фіксованої точки, який не потребує цифрового перетворення, а також підвищує стійкість до шуму. Виходячи з цієї фіксованої точки абстракції, AOC може запускати новий тип обчислювально інтенсивної нейронної моделі з рекурсивною здатністю до умовиводу та використовувати передові методи градієнта спуску для вирішення проблем з високою експресивністю.

Фігура | Схематична схема архітектури та застосувань AOC

Дослідницька група заявила, що архітектура AOC побудована на масштабованих технологіях споживачів, що забезпечує перспективний шлях для досягнення швидше та більш стійких обчислень. Він підтримує ітеративні, обчислювально інтенсивні моделі, забезпечуючи масштабовану аналогову обчислювальну платформу для майбутніх інновацій у галузі ШІ та оптимізації.

Аналоговий оптичний комп'ютер: як прискорити завдання AI та оптимізації?

AOC в основному спрямований на два типи завдань на рівні застосування: Завдання умовах умовах машинного навчання та завдання комбінаторної оптимізації. Дослідницька група продемонструвала можливості AOC у цих двох типах завдань через чотири типові випадки. Це дослідження також відображає переваги спільного дизайну апаратного забезпечення та шару абстракції, що перегукується з тенденцією спільної еволюції цифрових прискорювачів та глибоких моделей навчання.

Апаратне забезпечення AOC поєднує в собі 3D оптичну технологію з аналоговою електронною технологією та реалізує дві завдання з вивчення умовах на основі збалансованої моделі: класифікація зображень та нелінійна регресія. У цих двох завданнях моделі проходять цифрові навчання через AOC – DT і безпосередньо розгорнуті на обладнання без подальшої калібрування. Це ставить високі вимоги до точності обладнання, а також вимагає AOC – DT мати високу вірність.

У експерименті з класифікації зображень результати AOC довели доцільність використання цифрових тренувань та передачі ваг для оптоелектронного апаратного забезпечення для виводу. Порівнюючи результати AOC з лінійним класифікатором, внесок збалансованої моделі, що працює на AOC, є більш очевидним. Дослідники також підготували просту модель подачі вперед. Як лінійний класифікатор, так і модель подачі вперед мають таку ж кількість параметрів, як і обладнання AOC. Незважаючи на те, що AOC досягла дещо вищої швидкості точності, набори даних MNIST та моди – MNIST відносно прості, що ускладнює повну продемонстрування повного потенціалу самостійної моделі.

Дослідження показують, що апаратне забезпечення AOC може запускати нелінійні регресійні моделі. Вони вибрали дві нелінійні функції для регресії: Гауссова крива та синусова крива. Обладнання точно відтворювало ці дві функції. Порівняно з кривою Гаусса, синусова крива має кілька мінімумів та максимумів, що ставить більш високі вимоги до точності встановлення. Тому необхідна більш точна диференційована цифрова модель -близнюк (AOC – DT). Крім того, AOC надає підтримку збалансованої моделі, що працює на обладнанні.

Фігура | Застосування AOC у висновку машинного навчання

Qumo являє собою широкий спектр проблем комбінаторної оптимізаціїпрагнення до мінімізації цільової функції. Процес вирішення проблеми Qumo полягає в тому, щоб знайти набір змінних завдань, що мінімізують цільову функцію. Дослідницька група продемонструвала два типові сценарії застосування Qumo на апаратному забезпеченні AOC: реконструкція медичних зображень та врегулювання фінансових транзакцій.

Вони реалізували стиснене зондування на апаратному забезпеченні AOC, технології, яка може досягти точної реконструкції сигналу з меншою кількістю вимірювань. Кінцеві результати реконструкції зображення дуже узгоджуються з оригінальними лініями. Усі екземпляри Qumo були вирішені повністю аналоговим чином без будь -якої цифрової обробки. Для перевірки форми експресії Qumo стисненого зондування у великих масштабах, Дослідники використовували AOC – DT для реконструкції зображення сканування мозку з набору даних FastMRI. Ця проблема передбачає понад 200 000 змінних. При типових 4 – складних та 8 – складіть коефіцієнт підкреслення, середня помилка в квадраті (MSE) реконструкції менше 0,07.

У завданні фінансової оптимізації вони використовували апаратне забезпечення AOC для вирішення проблеми врегулювання транзакцій. Кожна транзакція з цінними паперами – це обмін платежами на цінні папери. Клірингові будинки обробляють партії таких транзакцій. У кожній партії транзакції мета врегулювання транзакцій – максимізувати загальну кількість або загальну вартість врегульованих транзакцій. Враховуючи велику кількість транзакцій та обмеження законів та інших додаткових вимог, це стає складною проблемою оптимізації. У цьому сценарії врегулювання транзакцій апаратне забезпечення AOC виявило глобальне оптимальне рішення в кроках 7 блоків координатного походження (BCD). Навпаки, рівень успішності квантового обладнання з тієї ж проблеми становить лише 40 – 60%.

Фігура | Застосування AOC в оптимізації

Використовуючи AOC – DT, дослідники також перевірили продуктивність алгоритму щодо найскладніших квадратних бінарних проблем з лінійними обмеженнями нерівності в тесті QPLIB. Ці проблеми сформульовані як екземпляри Qumo. Метод AOC порівнювали з комерційним розчиненням Gurobi, який зазвичай займає більше хвилини, щоб досягти відомого оптимального рішення щодо цих проблем.

Ця повністю аналогова операція мінімізує накладні витрати аналогової до – цифрової конверсії.

Майбутній потенціал: Досягнення збільшення енергоефективності на 100 – складання

Варто це зазначити Реальні – Світові програми розміщують більш високі вимоги до масштабованості обладнання. Щоб використовувати AOC для вирішення практичних завдань, його апаратне забезпечення повинно підтримувати масштабованість від сотень мільйонів до мільярдів ваг.

Дослідницька група заявила, що AOC має потенціал для задоволення цього попиту завдяки модульній архітектурі. Ця архітектура може розкласти операцію основної оптичної матриці – векторна операція множення на менші множники вектора та суб -матриці, що дозволяє масштабувати обчислення пам'яті.

Дослідницька група цього очікує AOC може підтримувати моделі з шкалою параметрів від 100 до 2 мільярдів, що відповідає необхідності від 50 до 1000 оптичних модулів. Якщо один оптичний модуль може одночасно обробляти як позитивні, так і негативні ваги, кількість необхідних модулів може бути зменшена вдвічі. Усі компоненти, що використовуються в AOC, включаючи мікролії, фотодетектори, SLMS та аналогові електронні пристрої, вже мають постійно розширювати виробничу екосистему, яка може підтримувати виробництво рівня вафель.

Швидкість роботи та споживання електроенергії AOC визначають його енергоефективність. Його швидкість обмежена пропускною здатністю оптоелектронних компонентів, як правило, 2 ГГц або вище. Для матриці зі 100 мільйонами ваг, при використанні 25 модулів AOC розрахункове споживання електроенергії становить 800 Вт, а обчислювальна швидкість 400 PETA – OPS може бути досягнута. При 8 – точність ваги бітової ваги, енергоефективність становить 500 вершин на ват. На відміну від цього, останні графічні процесори можуть досягти максимальної енергоефективності системи 4,5 вершини на ватт при обробці щільних матриць з однаковою точністю.

Підводячи підсумок, архітектура AOC показує хороші перспективи масштабування для практичних завдань з навчання та оптимізації, і, як очікується, досягне приблизно 100 – збільшення складання енергоефективності.

Дивлячись у майбутнє, Метод дизайну AOC – тісно вирівнюючи обладнання з алгоритмами машини – навчання та оптимізації – очікується, що він постійно керує інноваційним маховиком апаратних та алгоритмівщо має вирішальне значення для досягнення стійких обчислень.

Ця стаття є з офіційного облікового запису WeChat “Академічні заголовки” (ID: Scitoutiao). Автор – це академічні заголовки. Він публікується 36KR з авторизацією.

Alex

About Author

Recommend – дізнавайтеся більше про події, що формують наше сьогодення. Найцікавіші новини України та світу, аналітика, тренди та ексклюзивні матеріали – все це на recommend.com.ua!

Отримуйте останні оновлення та великі пропозиції