У AWS Re: Inquint 2024, ми оголосили наступне покоління Amazon Sagemaker, Центру всіх ваших даних, аналітики та AI. Amazon Sagemaker об'єднує широко прийняті машинне навчання AWS (ML) та аналітичні можливості та вирішує проблеми використання організаційних даних для аналітики та AI через єдиний доступ до інструментів та даних з вбудованим управлінням. Це дозволяє командам надійно знаходити, підготувати та співпрацювати над даними та збіркою до аналітики AI та AI через одноразовий досвід.
В основі наступного покоління Amazon Sagemaker лежить Amazon Sagemaker Unified Studio, єдине середовище розробки даних та AI, де ви можете знайти та отримати доступ до даних своєї організації та діяти на ньому за допомогою найкращого інструменту для роботи практично будь -якого випадку використання. Ми раді повідомити про загальну доступність Unified Studio Sagemaker.
У цій публікації ми досліджуємо переваги Unified Studio Sagemaker та як розпочати роботу.
Переваги Unified Studio Sagemaker
Sagemaker Unified Studio об'єднує функціональність та інструменти з існуючої аналітики AWS та послуг AI/ML, включаючи Amazon EMR, AWS Glue, Amazon Athena, Amazon Redshift, Amazon Bedrock та Amazon Sagemaker AI. Зсередини Unified Studio ви можете виявити дані та AI з усієї організації, а потім працювати разом у проектах, щоб надійно будувати та ділитися аналітикою та артефактами AI, включаючи дані, моделі та генеративні програми AI. Особливості управління, включаючи тонкозернистий контроль доступу, вбудовані в Unified Studio Sagemaker за допомогою каталогу Amazon SageMaker, щоб допомогти вам відповідати вимогам безпеки підприємства у всьому вашому маєтку даних.
Уніфікований доступ до ваших даних надається Amazon Sagemaker Lakehouse, уніфікованим, відкритим та захищеним даними Lakehouse, побудованим на відкритих стандартах Apache айсберг. Незалежно від того, що ваші дані зберігаються в озерах даних Simple Service Amazon (Amazon S3), складам даних Redshift Data або сторонніми та федераційними джерелами даних, ви можете отримати доступ до нього з одного місця та використовувати його з двигунами та інструментами, сумісними з айсбергом. Крім того, тепер Sagemaker Lakehouse інтегрується з таблицями Amazon S3, першим хмарним магазином об'єктів з рідною підтримкою Apache айсберга, тому ви можете використовувати таблиці Sagemaker Lakehouse для створення, запитів та обробки S3 таблиць, використовуючи різні двигуни аналітики в Sagemaker Unified Studio, а також Юзерг-беззахисні двигуни, такі як Apache Spark та Pyiceberg.
Можливості від Amazon Bedrock тепер загалом доступні в Unified Studio Sagemaker, що дозволяє швидко прототип, налаштувати та ділитися генеративними програмами AI у керованому середовищі. Користувачі мають інтуїтивний інтерфейс для доступу до високоефективних моделей фундаменту (FMS) в Amazon Bedrock, включаючи серію моделей Amazon Nova, та можливість створювати агенти, потоки, бази знань та Guardrails з кількома кліками.
Amazon Q Розробник, найбільш здібний генеративний помічник AI для розробки програмного забезпечення, може бути використаний у Unified Studio SageMaker для впорядкування завдань у різних даних та життєвого циклу AI, включаючи створення коду, генерацію SQL, виявлення даних та усунення несправностей.
Новий інтегрований спосіб роботи
Загальна доступність Unified Studio Sagemaker являє собою ще один змістовний крок у нашій подорожі, щоб запропонувати нашим клієнтам спрощений спосіб працювати з їх даними, чи то для аналітики чи АІ. Багато наших клієнтів сказали нам, що ви будуєте додатки, керовані даними, щоб керувати бізнес-рішеннями, покращити спритність та сприяти інноваціям, але що ці програми є складними для побудови, оскільки вони потребують співпраці між командами та інтеграцією даних та інструментів. Користувачі не тільки забирають багато часу, а тому, що дані, код та інші артефакти розвитку зберігаються окремо, користувачам є складно зрозуміти, як вони взаємодіють між собою та використовувати їх згуртовано. Налаштування та керуючий доступ також є громіздким ручним процесом. Щоб подолати ці перешкоди, багато організацій будують замовлення інтеграції між послугами, інструментами та системами управління доступом до дому. Однак, що вам потрібно, це гнучкість прийняти найкращі послуги для вашого випадку використання, одночасно надаючи можливість вашим командам даних з єдиним досвідом розробки.
«Коли ми будуємо програми, керовані даними, для наших клієнтів, ми хочемо єдиної платформи, де технології працюють разом інтегровано. Amazon Sagemaker Unified Studio впорядковує наші процеси доставки рішень за допомогою всебічних можливостей аналітики, уніфікованого досвіду студії та озера, що інтегрує управління даними у сховищах даних та озер даних. Amazon Sagemaker Unified Studio зменшує час для проектів даних наших клієнтів до 40%, допомагаючи нам у нашій місії прискорити подорож цифрової трансформації наших клієнтів “.
—Akihiro Suzue, керівник сектору рішень, дані NTT; Юджі Шоно, старший менеджер, відділ програм та технологій даних, дані NTT; Юкі Сайто, менеджер, відділ цифрових успіхів, дані NTT
Мільйони організацій довіряють AWS та використовують наш всеосяжний набір цілей, побудованої аналітики, AI/ML та генеративних можливостей AI, щоб забезпечити додатки, керовані даними, без шкоди для ефективності, масштабу чи витрат. Наша мета для наступного покоління Amazon Sagemaker, включаючи Sagemaker Unified Studio, – зробити дані та працівників AI більш продуктивними, надаючи доступ до всіх ваших даних та інструментів в єдиному середовищі розробки.
Побудова з одного середовища розвитку та AI
Давайте вивчимо загальний бізнес -виклик: збільшення доходу за рахунок кращого генерації свинцю. Розглянемо організацію, яка впроваджує інтелектуального цифрового помічника на своєму веб -сайті для спілкування з клієнтами – процес, який традиційно вимагає декількох інструментів та джерел даних. За допомогою Sagemaker Unified Studio тепер цей процес може здійснюватися в одному середовищі розвитку даних та AI.
По -перше, команда даних використовує генеративний майданчик AI в рамках Unified Studio Sagemaker, щоб швидко оцінити та вибрати найкращу модель для їх взаємодії з клієнтами. Потім вони створюють проект для розміщення інструментів та ресурсів, необхідних для їх використання, та використовують Amazon Bedrock в рамках проекту для створення та розгортання складного віртуального помічника, який швидко починає кваліфіковані потенційні клієнти через їхній веб -сайт.
Щоб визначити найбільш перспективні можливості, команда розробляє стратегію сегментації. Інженер даних просить Amazon Q Developer визначити набори даних, що містять дані про свинець, і використовує інтеграції нульової ETL для залучення даних у Sagemaker Lakehouse. Потім аналітик даних виявляє це і створює всебічний погляд на їх ринок. Вони використовують редактор запитів SQL для створення маркетингових сегментів, які вони потім записують до Sagemaker Lakehouse, де вони доступні іншим членам команди.
Нарешті, вчений даних отримує доступ до тієї ж набору даних, який вони використовують для навчання та розгортання автоматизованої моделі оцінювання свинцю за допомогою інструментів, доступних від Sagemaker AI. Під час фази розробки моделі вони використовують вбудовані можливості та усунення несправностей Amazon Q для ефективного запису вільного коду помилок у своєму ноутбуці jupyterlab. Заключна модель надає командам продажів найвищого значення, які вони можуть візуалізувати на інформаційній панелі бізнес-інтелекту та негайно вжити заходів.
Скорочення часу до вартості в єдиному середовищі
Що стосується цього прикладу, це те, що весь процес відбувається в одному інтегрованому середовищі. Без Sagemaker Unified Studio, команді довелося б працювати з декількома джерелами даних, інструментами та послугами, витрачати час на навчання декількох середовищ розробки, створення акцій ресурсів та налаштування контролю доступу вручну. Інженер даних та аналітик даних працювали б у різних сховищах даних, озерах даних та аналітичних інструментах, науковець даних працював би в студії ML Studio та ноутбук, а також розробник додатків у генеративному інструменті AI. Тепер вони можуть створити та співпрацювати з їхніми даними та інструментами, доступними в одному досвіді, різко скорочуючи вартість часу.
Ось чому ми так схвильовані від наступного покоління Amazon Sagemaker та загальної доступності Unified Studio Sagemaker. Ми вважаємо, що, поставивши все, що потрібно для аналітики та AI в одному місці, ви можете більш ефективно вирішити складні проблеми з кінцевим до кінця та досягти інноваційних результатів швидше, ніж будь-коли раніше.
Початок роботи з Unified Studio Sagemaker
Щоб дізнатися більше, перегляньте такі ресурси:
Про авторів
G2 Krishnamoorthy IS VP аналітики, провідні послуги AWS Data Lake, інтеграція даних, служба Amazon OpenSearch та Amazon Quicksight. До своєї нинішньої ролі G2 побудував та запустив платформу Analytics та ML у Facebook/Meta, і створив різні частини бази даних SQL Server, Azure Analytics та Azure ML в Microsoft.
Рахул Патхак IS VP двигунів реляційної бази даних, провідний Amazon Aurora, Amazon Redshift та Amazon QLDB. До своєї нинішньої ролі він був віце -президентом з аналітики в AWS, де він працював у всьому портфоліо баз даних AWS. Він був співзасновником двох компаній, однієї орієнтованої на цифрові медіа-аналітики, а другий-на IP-геолокацію.