Функции Amazon SageMaker Canvas

Создавайте высокоточные модели машинного обучения с помощью визуального интерфейса без необходимости написания кода

Разработка машинного обучения на основе чата с помощью Amazon Q для разработчиков

Amazon Q для разработчиков помогает преодолеть разрыв между бизнес-задачами и моделями машинного обучения. Она профессионально превращает бизнес-задачи в пошаговые рабочие процессы машинного обучения и объясняет термины машинного обучения на нетехническом языке.

Amazon Q для разработчиков предоставляет профессиональную помощь пользователям на каждом этапе разработки модели: от подготовки данных до создания, обучения и развертывания моделей машинного обучения. Используя интерфейс чата, Amazon Q для разработчиков предоставляет контекстную помощь и упрощает пользователям ориентирование в комплексном рабочем процессе машинного обучения для создания готовых к работе моделей машинного обучения.

Детерминированный конструктор конвейеров Amazon Q для разработчиков и передовые методы AutoML обеспечивают воспроизводимость и точность создания моделей. Предоставляя пользователям расширенные возможности анализа данных, Q для разработчиков позволяет оперативно экспериментировать, не теряя уверенности в полезности модели.

Amazon Q для разработчиков хранит такие артефакты, как исходные и преобразованные наборы данных, а также конвейеры подготовки данных, созданные с использованием естественного языка. Кроме того, модели, созданные с помощью Q для разработчиков, можно зарегистрировать в реестре моделей SageMaker, а блокноты моделей можно экспортировать для дальнейшей настройки и интеграции.

Подготовка данных

SageMaker Canvas подключается к более чем 50 источникам данных, кроме того, вы можете загружать локальные файлы для обучения модели машинного обучения. Поддерживаются табличные, графические и текстовые данные. Можно также писать запросы для доступа к источникам данных с помощью SQL и импортировать данные непосредственно в различных форматах файлов, таких как CSV, Parquet, ORC и JSON, а также таблицы баз данных.
С помощью интерфейса бескодовой разработки SageMaker Canvas вы можете изучать, визуализировать и анализировать данные, используя встроенные или настраиваемые визуализации. Одним щелчком мыши вы можете создать отчет Data Quality and Insight, чтобы проверить качество данных, например убедиться, что набор данных не содержит пропущенных значений или повторяющихся строк, а также обнаружить аномалии, такие как отклонения, дисбаланс классов и утечка данных.
SageMaker Canvas включает набор из более 300 готовых преобразований данных на основе PySpark, поэтому вы можете преобразовывать данные без необходимости написания кода. Кроме того, для подготовки данных можно использовать интерфейс чата на основе базовой модели.
SageMaker Canvas позволяет легко запустить или запланировать рабочий процесс подготовки данных для быстрой обработки данных и масштабирования подготовки данных по наборам данных, экспорта их в блокнот SageMaker Studio или интеграции с SageMaker Pipelines.

Доступ к моделям машинного обучения и их создание

С помощью интерфейса бескодовой разработки SageMaker Canvas вы можете автоматически создавать собственные модели машинного обучения, используя данные вашей компании. Выберите и подготовьте данные, задайте, что вы хотите спрогнозировать, и SageMaker Canvas определит тип проблемы, протестирует сотни моделей машинного обучения в зависимости от типа проблемы (используя такие методы машинного обучения, как линейная регрессия, логистическая регрессия, глубокое обучение, прогнозирование временных рядов и градиентный бустинг) и создаст пользовательскую модель, которая делает наиболее точные прогнозы на основе вашего набора данных. Кроме того, вы можете перенести свою собственную ранее созданную модель в SageMaker Canvas и развернуть ее для получения выводов.

SageMaker Canvas обеспечивает доступ к готовым табличным моделям, моделям NLP и CV для таких сценариев использования, как анализ настроений, обнаружение объектов на изображениях, обнаружение текста на изображениях и извлечение объектов. Готовые модели основаны на сервисах искусственного интеллекта AWS, включая Amazon Rekognition, Amazon Textract и Amazon Comprehend. Используя их, можно сэкономить время на построении моделей.

После создания модели вы можете оценить ее эффективность, прежде чем внедрить ее в рабочую среду, используя данные компании. Вы можете легко сравнить ответы моделей и выбрать наилучший вариант, соответствующий вашим требованиям.

SageMaker Canvas предоставляет доступ к готовой базовым моделям (FM) для создания контента, извлечения и реферирования текста. Вам предоставляется доступ к базовым моделям, таким как Claude 2, Llama-2, Amazon Titan, Jurassic-2 и Command (на базе Amazon Bedrock), а также к общедоступным базовым моделям, таким как Falcon, Flan-T5, Mistral, Dolly и MPT (на базе SageMaker JumpStart). Вы также можете настроить их, используя собственные данные.

Создание прогнозов машинного обучения

SageMaker Canvas обеспечивает визуальный анализ методом «что если», позволяющий изменить исходные данные модели, а затем проанализировать, как эти изменения влияют на отдельные прогнозы. Можно создавать автоматические пакетные прогнозы для всего набора данных, и при обновлении набора данных ваша модель машинного обучения будет обновляться автоматически. После обновления модели машинного обучения вы сможете просмотреть обновленные прогнозы в интерфейсе бескодовой разработки SageMaker Canvas.

Модель SageMaker Canvas можно развернуть на адресах SageMaker для получения логических выводов в реальном времени.

Делитесь прогнозами моделей с Amazon QuickSight, чтобы создавать информационные панели, объединяющие традиционную бизнес-аналитику и прогнозные данные в одном интерактивном визуальном представлении. Кроме того, модели SageMaker Canvas можно публиковать и интегрировать в QuickSight, чтобы аналитики могли создавать максимально точные прогнозы по новым данным в информационной панели QuickSight.

Использование MLOps

Модели машинного обучения, созданные в SageMaker Canvas, можно зарегистрировать в реестре моделей SageMaker одним щелчком мыши, чтобы интегрировать модель в существующие процессы CI/CD развертывания моделей.

Моделями SageMaker Canvas можно делиться с аналитиками данных, которые используют SageMaker Studio. Затем специалисты, занимающиеся обработкой и анализом данных, смогут просматривать и обновлять модели, делиться с вами обновленными моделями или использовать их для получения логических выводов.