Общие вопросы

Вопрос. Что такое Amazon SageMaker?

Amazon SageMaker – это полностью управляемый сервис, который предоставляет каждому разработчику и специалисту по работе с данными возможность быстро создавать, обучать и развертывать модели машинного обучения (ML). SageMaker берет на себя большую часть работы на каждом этапе машинного обучения, чтобы упростить разработку высококачественных моделей.

Вопрос. В каких регионах доступен Amazon SageMaker?

Список регионов AWS с поддержкой сервиса Amazon SageMaker можно найти в таблице регионов AWS для всей глобальной инфраструктуры AWS. См. также регионы и адреса серверов в общих справочных материалах по AWS.

Вопрос. Какова доступность сервиса Amazon SageMaker?

Amazon SageMaker разработан для обеспечения высокой доступности. Сервис работает без плановых простоев и перерывов на обслуживание. API SageMaker работают на базе надежных ЦОД Amazon с высокой степенью доступности, стек сервиса реплицируется в трех ЦОД в каждом регионе AWS, что обеспечивает отказоустойчивость в случае выхода из строя отдельного сервера или аварийного отключения зоны доступности.

Вопрос. Как обеспечивается безопасность кода в Amazon SageMaker?

Amazon SageMaker хранит код в томах хранилища для машинного обучения, которые защищены группами безопасности и могут быть дополнительно зашифрованы при хранении.

Вопрос. Какие меры обеспечения безопасности использует сервис Amazon SageMaker?

Amazon SageMaker обеспечивает шифрование моделей машинного обучения и других системных артефактов как при хранении, так и при пересылке. Запросы к API и консоли сервиса SageMaker выполняются через безопасное SSL-соединение. Права доступа к ресурсам для обучения и развертывания от имени клиента предоставляются сервису SageMaker путем передачи ему соответствующих ролей AWS Identity and Access Management. Зашифрованные корзины Amazon S3 можно использовать для хранения данных и артефактов моделей, также вы можете применять ключ KMS в блокнотах SageMaker, заданиях по обучению и адресах сервиса, чтобы шифровать подключенный тома хранилища для машинного обучения. Amazon SageMaker также поддерживает Amazon Virtual Private Cloud (VPC) и AWS PrivateLink.

Вопрос. Использует ли Amazon SageMaker модели, обучающие данные, алгоритмы или предоставляет общий доступ к ним?

Amazon SageMaker не использует модели, обучающие данные и алгоритмы клиентов и не предоставляет общий доступ к ним. Мы знаем, что наши клиенты глубоко заинтересованы в обеспечении безопасности и конфиденциальности данных. Поэтому AWS предоставляет клиентам право собственности и контроль над их контентом с помощью простых и эффективных инструментов. Эти инструменты позволяют определить, где будет храниться контент, обеспечить его безопасность при передаче и хранении, а также управлять доступом пользователей к сервисам и ресурсам AWS. Мы также реализуем надежные комплексные средства технического и физического контроля, которые предотвращают несанкционированный доступ к пользовательскому контенту или раскрытие информации. Клиенты сохраняют право собственности на свой контент и выбирают, какие сервисы AWS могут обрабатывать, хранить и размещать контент. Мы не получаем доступ к контенту клиентов для каких-либо целей без соответствующего согласия.

Вопрос. Как начисляется плата за использование Amazon SageMaker?

Плата начисляется за вычислительные ресурсы, хранилище и ресурсы для обработки данных, которые используются для размещения блокнотов, обучения моделей, расчета прогнозов и ведения журнала выходных данных. Amazon SageMaker позволяет выбрать число и тип инстансов, которые будут использованы для размещения блокнотов, обучения и хостинга моделей. Вы платите только за то, что используете. Минимальные платежи и авансовые обязательства отсутствуют. Подробнее см. на странице цен на Amazon SageMaker.

Вопрос. Как я могу оптимизировать свои расходы на Amazon SageMaker, например обнаруживать и удалять простаивающие ресурсы, чтобы избежать ненужных расходов?

Есть несколько передовых методов, которые можно использовать для оптимизации использования ресурсов Amazon SageMaker. Некоторые подходы включают оптимизацию конфигурации, другие — программные решения. Полное руководство по этой концепции, вместе с наглядными руководствами и примерами кода, можно найти в этой публикации в блоге.

Вопрос. Могу ли я использовать свой блокнот, среду обучения или хостинга?

Amazon SageMaker полностью обеспечивает все этапы рабочего процесса, однако это не мешает использовать существующие инструменты вместе с SageMaker. В зависимости от конкретных практических потребностей можно легко импортировать результаты в SageMaker либо экспортировать их из сервиса на любом этапе рабочего процесса.

Вопрос. поддерживается ли R в Amazon SageMaker?

Да, R поддерживается в Amazon SageMaker. Вы можете использовать R в инстансах блокнотов SageMaker, в которые входит предварительно установленное ядро R и библиотека reticulate. Библиотека reticulate реализует интерфейс R для Amazon SageMaker Python SDK, благодаря чему изучающие машинное обучение специалисты могут создавать, обучать, настраивать и развертывать модели на базе языка R. 

Вопрос. Как можно выявить дисбаланс в модели?

Amazon SageMaker Clarify помогает повысить прозрачность модели, выявляя статистические смещения в рабочем потоке машинного обучения. SageMaker Clarify проверяет наличие дисбаланса на этапах подготовки данных, после обучения модели и далее через некоторые интервалы времени, а также предоставляет средства для понимания моделей машинного обучения и полученных через них прогнозов. Полученные результаты можно предоставлять другим через отчеты с объяснениями.

Вопрос. Какие типы смещений выявляет Amazon SageMaker Clarify?

Оценка смещений в моделях машинного обучения необходима для того, чтобы устранить такие смещения. Смещения можно оценивать как до, так и после обучения, а также использовать эту оценку для вывода в развернутой модели. Каждое измерение смещения соответствует определенному представлению справедливости. Даже самые простые методы оценки справедливости могут приводить к очень разным подходам, в разной степени применимым в разных контекстах. Нам нужно выбрать методы и метрики оценки смещений, которые имеют смысл для конкретного приложения в конкретной изучаемой ситуации. В настоящее время мы поддерживаем вычисление разных метрик смещения для обучающих данных (в ходе подготовки данных в SageMaker), для обученной модели (в SageMaker Experiments) и для вывода в развернутой модели (при использовании SageMaker Model Monitor). Например, перед обучением доступны метрики, позволяющие проверить репрезентативность обучающих данных (отсутствие плохо представленных групп) и разногласия в распределении меток для разных групп. После обучения и во время развертывания наши метрики помогут оценить, как и насколько различается поведение модели для разных групп. Например, для начала можно сравнить долю ошибок (вероятность отклонения предсказаний модели от фактической метки) или углубиться чуть дальше, отдельно оценивая точность (вероятность того, что положительное предсказание окажется верным) и отклик (вероятность того, что модель правильно обнаружит установленную для образца метку).

Вопрос. Каким образом Amazon SageMaker Clarify улучшает понимание моделей?

Интеграция Amazon SageMaker Clarify с SageMaker Experiments позволяет после обучения модели получить граф важности признаков с подробной информацией о вкладе каждого элемента входных данных в общий процесс принятия решений. Эти сведения помогут вам заметить, если некоторый отдельный элемент слишком сильно влияет на поведение модели. Также SageMaker Clarify выдает объяснения по отдельным прогнозам, возвращаемым через API, что будет полезно при общении с клиентами или руководством организации.
 

Вопрос. Что такое Amazon SageMaker Studio?

Amazon SageMaker Studio предоставляет единый визуальный веб‑интерфейс, в котором можно проводить все этапы разработки ML. SageMaker Studio обеспечивает полный доступ, контроль и прозрачность каждого шага, необходимого для создания, обучения и развертывания моделей. Теперь можно быстро загружать данные, создавать новые блокноты, обучать и настраивать модели, перемещаться между любыми этапами, настраивать эксперименты, сравнивать результаты и развертывать модели в одном месте, что благотворно сказывается на эффективности процесса. Все действия по ML‑разработке, включая создание блокнотов, управление экспериментами, автоматизированное создание моделей, отладку и профилирование, а также обнаружение отклонений в моделях, можно выполнять в едином визуальном интерфейсе SageMaker Studio.

Вопрос. Как рассчитываются цены за использование Amazon SageMaker Studio?

Дополнительная плата за использование Amazon SageMaker Studio не начисляется. Вы оплачиваете только базовые тарифы за вычисления и хранение для сервисов, которые используете с Amazon SageMaker Studio.

Вопрос. В каких регионах поддерживается Amazon SageMaker Studio?

Регионы с поддержкой Amazon SageMaker Studio можно найти в этой документации.

Малокодовое машинное обучение

Вопрос. Что такое Amazon SageMaker Autopilot?

Amazon SageMaker Autopilot – это первый в отрасли сервис автоматического машинного обучения, который предоставляет полный контроль над ML‑моделями и обеспечивает прозрачность всех процессов. SageMaker Autopilot автоматически проверяет необработанные данные, применяет обработчики возможностей, выбирает лучший набор алгоритмов, обучает и настраивает множество моделей, отслеживает их производительность, а затем ранжирует модели на основе их производительности – и все это за несколько щелчков мышью. В результате создается готовая для развертывания модель с наилучшими характеристиками, причем во много раз быстрее, чем обычно происходит обучение модели. При этом пользователю обеспечивается полное представление о том, как была создана модель и что в ней есть. Сервис SageMaker Autopilot интегрирован с Amazon SageMaker Studio. Благодаря этому можно изучить до 50 различных моделей, созданных SageMaker Autopilot, в SageMaker Studio, и без труда выбрать оптимальную модель для своего примера использования. SageMaker Autopilot могут использовать как люди, не имеющие опыта машинного обучения, для простого создания моделей, так и опытные разработчики – для быстрой разработки базовой модели, которую можно использовать в команде для дальнейших итераций.

Вопрос. Чем Amazon SageMaker Autopilot отличается от вертикальных сервисов искусственного интеллекта, таких как Amazon Personalize и Amazon Forecast?

Amazon Personalize и Amazon Forecast предназначены специально для сценариев персонализированных рекомендаций и прогнозов, тогда как Amazon SageMaker Autopilot является универсальным решением для задач классификации и регрессии на основе автоматического машинного обучения, таких как обнаружение мошенничества, анализ оттока клиентов и целевой маркетинг. Сервисы Personalize и Forecast нацелены на упрощение всего процесса работы, предоставляя комплексное решение для обучения и размещения моделей. С помощью Amazon SageMaker Autopilot вы можете обучить модели и получить полный доступ к ним, а также к использованным для их создания конвейерам. После этого готовые модели можно разместить в любом удобном для вас сервисе или подвергнуть дополнительной обработке для повышения качества.

Вопрос. Какие встроенные алгоритмы поддерживает Amazon SageMaker Autopilot?

При запуске Amazon SageMaker Autopilot поддерживает два встроенных алгоритма: XGBoost и Linear Learner.

Вопрос. Можно ли вручную остановить задание Amazon SageMaker Autopilot?

Да. Вы можете остановить работу в любое время. При остановке задания Amazon SageMaker Autopilot прекращаются все текущие исследования, а новые не запускаются.

Вопрос. Как быстро начать работу с Amazon SageMaker?

Amazon SageMaker JumpStart помогает быстро и легко начать работу с машинным обучением. В SageMaker JumpStart есть набор решений, которые могут использоваться в большинстве типичных ситуаций и быстро развертываются всего за несколько щелчков мыши. Эти полностью настраиваемые решения демонстрируют применение шаблонов и примеров архитектуры AWS CloudFormation, чтобы вы могли ускорить процесс освоения машинного обучения. Amazon SageMaker JumpStart также поддерживает развертывание за один щелчок мыши и точную настройку для более чем 150 популярных моделей с открытым исходным кодом, в том числе моделей для преобразования, обнаружения объектов и классификации изображений.
 

Вопрос. Какие модели с открытым исходным кодом поддерживаются в Amazon SageMaker JumpStart?

Amazon SageMaker JumpStart включает более 150 предварительно обученных моделей с открытым исходным кодом из PyTorch Hub и TensorFlow Hub. Для задач, связанных с компьютерным зрением, например для классификации изображений и обнаружения объектов, вы можете применить модели ResNet, MobileNet и Single-Shot Detector (SSD). Для текстовых задач, например для классификации предложений и текста, поиска ответов на вопросы, можно использовать модели BERT, RoBERTa или DistilBERT.

Вопрос. Какие встроенные решения поставляются вместе с Amazon SageMaker Jumpstart?

SageMaker JumpStart включает решения, уже дополненные всеми необходимыми сервисами AWS для запуска решения в производственной среде. Эти решения полностью персонализируемы, благодаря чему вы можете с легкостью адаптировать их для своих сценариев использования и наборов данных. Вы можете использовать решения для более 15 сценариев, включая прогнозирование спроса, выявление мошенничества и профилактическое обслуживание, а также развертывать решения за несколько щелчков мышью. Более подробная информация о доступных решениях содержится на странице начала работы с SageMaker.
 

Вопрос. Как рассчитываются цены за использование Amazon SageMaker JumpStart?

Вам будет выставляться счет за все сервисы AWS, запущенные с использованием SageMaker JumpStart, в том числе для задач обучения и работы адресов, на основе цен на SageMaker. Дополнительная плата за использование Amazon SageMaker JumpStart не начисляется.

Рабочие процессы машинного обучения

Вопрос. Как создать конвейер CI/CD с помощью Amazon SageMaker?

Amazon SageMaker Pipelines поможет вам создать полностью автоматизированные рабочие процессы машинного обучения, от подготовки данных до развертывания модели, позволяя компаниям увеличить количество используемых моделей машинного обучения до нескольких тысяч.. SageMaker Pipelines предоставляет Python SDK, который подключается к SageMaker Studio и позволяет создать каждый шаг рабочего процесса через визуальный интерфейс. Используя один полнофункциональный API, вы сможете соединить эти шаги в готовый рабочий процесс. SageMaker Pipelines возьмет на себя все управление данными при переходах между шагами, упаковку рецептов кода и оркестрацию выполнения, снижая время подготовки и программирования с нескольких месяцев до нескольких часов. При каждом выполнении рабочего процесса сохраняется информация обо всех обработанных данных и выполненных действиях, что позволяет специалистам по работе с данными и разработчикам систем машинного обучения быстро диагностировать и устранять проблемы.

Вопрос. Как просмотреть все свои обученные модели, чтобы выбрать лучшую для запуска в рабочей среде?

Amazon SageMaker Pipelines предоставляет центральный репозиторий обученных моделей, который называется реестром моделей. Вы можете подбирать модели и изучать реестр моделей через визуальный интерфейс SageMaker Studio или программным образом через Python SDK, что дает вам свободу в выборе методов развертывания модели.

Вопрос. Какие компоненты Amazon SageMaker можно добавить в Amazon SageMaker Pipelines?

В SageMaker Pipelines можно добавить любые компоненты, доступные в Amazon SageMaker Studio, в том числе SageMaker Clarify, SageMaker Data Wrangler, SageMaker Feature Store, SageMaker Experiments, SageMaker Debugger и SageMaker Model Monitor.

Вопрос. Как можно отслеживать компоненты своих моделей на всем протяжении рабочего процесса машинного обучения?

Amazon SageMaker Pipelines автоматически сохраняет информацию обо всех компонентах модели и аудиторский след любых изменений, что устраняет необходимость в ручном отслеживании и может помочь вам достичь целей соответствия требованиям. С SageMaker Pipelines вы можете отслеживать данные, код, обученные модели и т. п.

Вопрос. Каковы принципы оплаты Amazon SageMaker Pipelines?

Дополнительная плата за использование Amazon SageMaker Pipelines не начисляется. Вы оплачиваете только базовые вычисления и отдельные сервисы AWS, которые используете совместно с SageMaker Pipelines.

Вопрос. Можно ли использовать Kubeflow с Amazon SageMaker?

Да. Компонентами Amazon SageMaker для Kubeflow Pipelines являются подключаемые модули с открытым исходным кодом, которые позволяют использовать Kubeflow Pipelines для определения рабочих процессов машинного обучения и применять SageMaker для маркировки данных, обучения и вывода. Kubeflow Pipelines – это дополнение к Kubeflow, которое позволяет создавать и развертывать портативные масштабируемые комплексные конвейеры машинного обучения. Однако при использовании Kubeflow Pipelines операционным командам по машинному обучению необходимо управлять кластером Kubernetes на инстансах CPU и GPU и постоянно поддерживать высокий уровень его использования, чтобы снижать эксплуатационные расходы. Добиться максимального использования кластера со стороны подразделений по анализу и обработке данных достаточно сложно, что приводит к тому, что подразделения по операциям машинного обучения сталкиваются с дополнительными эксплуатационными расходами. Альтернативой кластеру Kubernetes, оптимизированному для машинного обучения, являются компоненты Amazon SageMaker для Kubeflow Pipelines. С их помощью можно использовать преимущества мощных возможностей SageMaker, таких как маркировка данных, полностью управляемая масштабируемая настройка гиперпараметров и распределенные задания обучения, безопасное и масштабируемое развертывание модели за один щелчок мышью и экономически эффективное обучение с использованием спотовых инстансов Amazon EC2. При этом настраивать кластеры Kubernetes специально для выполнения заданий машинного обучения и управлять ими не требуется.

Вопрос. Каковы принципы оплаты использования Amazon SageMaker Components для Kubeflow Pipelines?

Дополнительная плата за использование Amazon SageMaker Components для Kubeflow Pipelines не начисляется.
 

Подготовка данных

Вопрос. Как Amazon SageMaker подготавливает данные для машинного обучения?

Amazon SageMaker Data Wrangler сокращает время, необходимое для сбора и подготовки данных для машинного обучения. Используя единый интерфейс SageMaker Studio, вы можете импортировать данные из Amazon S3, Amazon Athena, Amazon Redshift, AWS Lake Formation и Amazon SageMaker Feature Store, а всего несколькими кликами мыши можно автоматически загрузить, обработать и отобразить исходные данные в SageMaker Data Wrangler. Затем этот сервис предоставит вам рекомендации по преобразованию для полученных исходных данных, преобразует их для создания новых признаков, проверит эти признаки и визуально отобразит рекомендации по устранению типичных ошибок, например неправильно проставленных меток. Когда подготовка данных будет завершена, вы можете создать полностью автоматизированные рабочие процессы машинного обучения с помощью Amazon SageMaker Pipelines или импортировать эти данные в Amazon SageMaker Feature Store.

Вопрос. Как создавать признаки для модели в Amazon SageMaker Data Wrangler?

Amazon SageMaker Data Wrangler может автоматически преобразовать данные для получения новых признаков, избавляя от создания кода вручную. SageMaker Data Wrangler предлагает большой ассортимент заранее настроенных преобразований данных, таких как изменение типа столбца, конвертация в унитарный код, замена недостающих значений средними или медианными, изменение масштаба столбцов, внедрение даты и времени. Например, вы можете всего одним щелчком мыши преобразовать столбец текстовых полей в числовой столбец, а также выполнить другие нужные вам преобразования в PySpark, SQL и Pandas.

Вопрос. Как визуализировать данные в Amazon SageMaker Data Wrangler?

Amazon SageMaker Data Wrangler поможет вам разобраться в данных и выявить потенциальные ошибки и предельные значения с помощью набора надежных предварительно настроенных шаблонов визуализации. Гистограммы, графики рассеивания и оптимизированные для машинного обучения визуализации, например для обнаружения утечек, доступны без необходимости написания кода. Также вы можете создавать и редактировать собственные визуализации.

Вопрос. Каковы принципы оплаты Amazon SageMaker Data Wrangler?

Вы платите за все ресурсы для вычислений, хранения и обработки данных, применяемые для машинного обучения при работе с Amazon SageMaker Data Wrangler. Все подробности ценообразования на Amazon SageMaker Data Wrangler можно найти здесь. В рамках уровня бесплатного пользования AWS работу с SageMaker Data Wrangler можно начать бесплатно.

Вопрос. Как сохранить признаки для моделей машинного обучения?

Amazon SageMaker Feature Store предоставляет центральный репозиторий для признаков данных с низкой задержкой чтения и записи, измеряемой в миллисекундах. С SageMaker Feature вы можете сохранять, получать, искать и передавать в совместное пользование признаки моделей, что позволяет легко применять их для разных моделей и в разных проектах, сохраняя защиту доступа и полный контроль. SageMaker Feature Store поддерживает локальные признаки, созданные как при пакетной, так и при потоковой обработке. Также поддерживается заполнение исторических данных, локальные и сетевые хранилища для сохранения соответствия между признаками, используемыми для обучения моделей и вывода прогнозов.

Вопрос. Как поддерживать согласованность локальных и сетевых признаков?

Amazon SageMaker Feature Store автоматически поддерживает согласованность локальных и сетевых признаков без дополнительных действий по управлению или программированию. SageMaker Feature Store полностью управляем и сохраняет согласованность между средами обучения и вывода.

Вопрос. Как воспроизвести признак на конкретный момент времени?

Amazon SageMaker Feature Store поддерживает временные метки для всех признаков на любой момент времени. Это позволяет в любой момент получить признаки, которые использовались на конкретный момент времени, если это потребуется для бизнеса или соответствия требованиям. Вы можете легко описать признаки модели и значения признаков на любой момент, начиная с их создания и заканчивая текущим временем, воспроизводя модель в том состоянии, в котором она находилась в нужный момент.

Вопрос. Что такое локальные признаки?

Локальные признаки используются для обучения, когда важно иметь доступ к очень большим объемам данных в течение длительного периода времени. Эти признаки обслуживаются репозиторием с высокой пропускной способностью и широкой полосой пропускания.

Вопрос. Что такое сетевые признаки?

Сетевые признаки используются в приложениях, требующих прогнозирования в режиме реального времени. Для сетевых признаков используются репозитории с высокой пропускной способностью и задержкой менее 10 мс, чтобы очень быстро получать прогнозы.

Вопрос. Каковы принципы оплаты использования Amazon SageMaker Feature Store?

В рамках уровня бесплатного пользования AWS работу с Amazon SageMaker Feature Store можно начать бесплатно. При работе с SageMaker Feature Store вы оплачиваете операции записи в хранилище признаков, а также операции чтения и записи в сетевое хранилище признаков. На странице цен на SageMaker содержатся все сведения о ценообразовании на SageMaker Feature Store.

Вопрос. Что такое Amazon SageMaker Ground Truth?

Amazon SageMaker Ground Truth предоставляет функцию автоматизированного назначения меток с использованием машинного обучения. SageMaker Ground Truth первым делом отбирает случайный срез данных и отправляет его в Amazon Mechanical Turk для назначения меток. Затем эти результаты применяются для обучения модели маркировки, которая пытается автоматически присвоить метки следующему срезу необработанных данных. Присвоенные моделью метки подтверждаются, когда оценка уверенности для них достигает или превышает заданное вами пороговое значение. В тех случаях, для которых оценка уверенности не достигает порогового значения, данные отправляются специалистам по маркировке. Часть этих данных, промаркированных людьми, используется для формирования нового обучающего набора данных, по которым автоматически выполняется повторное обучение модели для повышения ее точности. Этот процесс повторяется для каждого набора необработанных данных, для которого выполняется маркировка. С каждой итерацией модель маркировки становится все более пригодной для автоматического присвоения меток и все меньше данных отправляется на обработку специалистам.
 

Создание моделей

Вопрос. Что такое блокноты Amazon SageMaker Studio Notebooks?

Блокнот Amazon SageMaker Studio – это новый гибкий и управляемый блокнот Jupyter для совместной работы, входящий в Amazon SageMaker Studio, полностью интегрированную среду разработки для машинного обучения.

Вопрос. Чем блокноты SageMaker Studio отличаются от блокнотов на базе инстансов?

Блокноты SageMaker Studio отличаются от блокнотов на базе инстансов несколькими важными возможностями. Теперь можно быстро запускать блокноты, поскольку не нужно тратить время на инициализацию инстанса вручную и ждать, пока он будет готов. Для запуска пользовательского интерфейса для чтения и выполнения кода в блокноте требуется меньше времени, чем при работе с блокнотами на базе инстансов.

Кроме того, в пользовательском интерфейсе можно в любой момент свободно выбирать типы инстансов из большой коллекции. Вам больше не нужно открывать консоль AWS для запуска новых инстансов и переноса блокнотов.

У каждого пользователя есть изолированный домашний каталог, независимый от определенного инстанса. Этот каталог автоматически подключается ко всем серверам и ядрам блокнотов по мере их запуска, поэтому у пользователей сохраняется доступ к блокнотам и другим файлам даже при переключении между инстансами для просмотра и запуска блокнотов.

Блокноты SageMaker Studio интегрированы в систему AWS SSO, поэтому для доступа к ним можно использовать корпоративные данные. В блокнотах SageMaker Studio предусмотрена возможность их совместного использования. Достаточно одного щелчка, чтобы начать использовать блокноты вместе с коллегами.

Вопрос. Какие типы блокнотов поддерживаются?

В данный момент поддерживаются блокноты Jupyter.

Вопрос. Как работают блокноты Amazon SageMaker Studio?

Блокноты Amazon SageMaker Studio – это готовые блокноты Jupyter, которые можно быстро развернуть. Лежащие в основе сервиса вычислительные ресурсы полностью эластичны, что позволяет просто увеличивать или уменьшать их объем, причем любые изменения происходят автоматически в фоновом режиме и не прерывают работу. SageMaker также позволяет делиться блокнотами одним щелчком мыши. Вы можете легко делиться блокнотами с другими – они получат точно такой же блокнот, сохраненный в том же месте.

В блокнотах SageMaker Studio вы можете выполнить вход с помощью корпоративных данных для доступа, используя систему AWS SSO. Совместное использование блокнотов в пределах одной команды и между несколькими командами очень легко организовать благодаря автоматическому отслеживанию всех зависимостей для выполнения блокнота по всем рабочим образам, которые инкапсулируются в блокноты при предоставлении совместного доступа.

Вопрос. Как блокноты Amazon SageMaker Studio взаимодействуют с другими сервисами AWS?

Блокноты Amazon SageMaker Studio предоставляют доступ ко всем функциям SageMaker, включая распределенное обучение, пакетное преобразование, размещение и управление экспериментами. Для получения наборов данных можно обращаться из блокнотов SageMaker к таким сервисам, как Amazon S3, Amazon Redshift, AWS Glue, Amazon EMR и AWS Lake Formation.

Вопрос: Как происходит расчет платы за использование блокнотов SageMaker Studio?

При использовании блокнотов SageMaker Studio плата взимается как за вычислительные ресурсы, так и за хранение данных. Сведения о тарифах в зависимости от типа вычислительного инстанса см. на странице цен на Amazon SageMaker. Ваши блокноты и связанные с ними артефакты, такие как файлы данных и скрипты, сохраняются в Amazon EFS. Сведения о тарифах на хранение данных см. на странице цен на Amazon EFS. В рамках уровня бесплатного пользования AWS работу с блокнотами Amazon SageMaker Studio можно начать бесплатно.

Вопрос: Нужно ли платить отдельно за каждый блокнот, созданный и запущенный в SageMaker Studio?

Нет. Вы можете создать и запустить несколько блокнотов на одном вычислительном инстансе. Вы платите только за используемые вычислительные ресурсы, а не за отдельные элементы. Более подробные сведения см. в нашем руководстве по учету.

Помимо блокнотов, вы также можете запускать терминалы и интерактивные оболочки Studio – и все это на одном вычислительном инстансе. Каждое приложение работает внутри контейнера или образа. SageMaker Studio предоставляет несколько встроенных образов, специально созданных и настроенных для задач аналитики данных и машинного обучения. Более подробные сведения о среде разработки Studio см. в нашем руководстве по использованию блокнотов SageMaker Studio.

Вопрос: Как отслеживать и отключать ресурсы, которые используются моими блокнотами?

Вы можете отслеживать и отключать ресурсы, используемые вашими блокнотами SageMaker Studio, через визуальный интерфейс SageMaker Studio и консоль управления AWS. Подробнее см. в документации.

Вопрос: Я использую блокнот SageMaker Studio. Будет ли с меня взиматься плата, если я закрою браузер, закрою вкладку блокнота или просто оставлю браузер открытым?

Да, с вас по-прежнему будет взиматься плата за использование вычислительных ресурсов. Эта ситуация схожа с запуском инстансов EC2 в консоли управления AWS с последующим закрытием браузера. Инстансы EC2 все еще будут работать, и с вас по-прежнему будет взиматься плата, пока вы явным образом не отключите инстанс.

Вопрос: Взимается ли плата за создание и настройку домена Studio?

Нет, плата за создание или настройку домена Studio, а также добавление, обновление и удаление профилей пользователей не взимается.

Вопрос: Как просмотреть подробные сведения о расходах на блокноты Studio или другие сервисы SageMaker?

Будучи администратором, вы можете просмотреть список детализированных платежей за SageMaker, включая Studio, в консоли выставления счетов AWS. В консоли управления AWS для SageMaker выберите Сервисы в верхнем меню, введите Оплата в поле поиска и выберите «Оплата» в раскрывающемся списке, затем выберите Счета на левой панели. В разделе «Подробности» вы можете щелкнуть SageMaker, чтобы развернуть список регионов и перейти к детализированным расходам.

Обучение моделей

Вопрос. Что такое Amazon SageMaker Experiments?

Сервис Amazon SageMaker Experiments помогает организовывать и отслеживать итерации обучения моделей машинного обучения. Сервис SageMaker Experiments помогает управлять итерациями, автоматически фиксируя входные параметры, конфигурации и результаты и сохраняя их как эксперименты. Работать при этом можно в визуальном интерфейсе SageMaker Studio, который дает возможность просматривать текущие эксперименты, искать предыдущие эксперименты по характеристикам, просматривать предыдущие эксперименты вместе с результатами и визуально сравнивать полученные результаты между собой.

Вопрос. Что такое Amazon SageMaker Debugger?

Отладчик Amazon SageMaker Debugger автоматически в режиме реального времени выполняет в процессе обучения сбор таких метрик, как обучение и проверка, матрицы путаницы и градиенты обучения, что в итоге помогает повысить точность модели. Метрики от SageMaker Debugger можно визуализировать в SageMaker Studio для удобства понимания. SageMaker Debugger может генерировать предупреждения и рекомендации по исправлению обнаруженных типовых проблем с обучением. Также SageMaker Debugger автоматически отслеживает и оценивает в реальном времени такие ресурсы, как ЦП, графический процессор, сеть и память, предоставляя рекомендации по перераспределению этих ресурсов. Это позволяет вам эффективнее использовать ресурсы в процессе обучения, помогает снизить расходы и уменьшить потребность в ресурсах.

Вопрос. Поддерживает ли Amazon SageMaker распределенное обучение?

Да. Amazon SageMaker может автоматически распределять модели глубокого обучения и крупные обучающие наборы по инстансам AWS с графическим процессором за время, во много раз меньшее, чем требуется на создание и оптимизацию стратегий распределения вручную. SageMaker применяет два метода распределенного обучения: параллелизм данных и параллелизм моделей. Параллелизм данных применяется для ускорения обучения: данные разбиваются на равные сегменты с последующей одновременной обработкой на разных инстансах с графическим процессором. Параллелизм моделей удобен в тех случаях, когда модель слишком велика для хранения на одном графическом процессоре: такая модель разделяется на несколько меньших частей и обрабатывается на нескольких графических процессорах. Вам нужно лишь добавить пару строк кода в скрипты обучения на PyTorch и TensorFlow, чтобы SageMaker автоматически применил параллелизм данных или параллелизм моделей, что позволит быстрее создавать и развертывать модели. SageMaker определит оптимальный метод разделения модели, используя алгоритмы секционирования графов, чтобы добиться примерно равного времени обработки на каждом графическом процессоре с минимальным взаимодействием между инстансами. Также SageMaker оптимизирует распределенные задания по обучению, используя алгоритмы максимально эффективного использования вычислительных и сетевых ресурсов AWS, чтобы добиться почти линейного роста эффективности при масштабировании и выполнять обучение быстрее, чем с помощью реализаций с открытым исходным кодом.

Вопрос. Что такое управляемое спотовое обучение?

Управляемое спотовое обучение с использованием Amazon SageMaker позволяет обучать модели машинного обучения с помощью спотовых инстансов Amazon EC2 и при этом снизить затраты на него до 90%.

Вопрос. Как использовать управляемое спотовое обучение?

Отправляя запросы на выполнение своих заданий по обучению, вы активируете управляемое спотовое обучение и указываете, в течение какого периода хотите ждать спотовые ресурсы. Затем Amazon SageMaker использует спотовые инстансы Amazon EC2 для выполнения задания и управляет спотовыми ресурсами. Вы полностью видите состояние задания по обучению как в процессе его выполнения, так и во время ожидания ресурсов.

Вопрос. В каких случаях стоит использовать управляемое спотовое обучение?

Управляемое спотовое обучение – идеальный вариант, когда у вас есть некоторая свобода в выполнении заданий по обучению, а также если вы хотите минимизировать затраты на такие задания. Благодаря управляемому спотовому обучению затраты на обучение моделей машинного обучения можно снизить до 90 %.

Вопрос. Как работает управляемое спотовое обучение?

Для обучения в таком формате используются спотовые инстансы Amazon EC2, которые можно освободить, когда AWS понадобятся ресурсы. Таким образом, задания по управляемому спотовому обучению можно разбить на небольшие этапы и выполнять их по мере доступности ресурсов. В случае прерывания задания по обучению не придется начинать с самого начала, поскольку Amazon SageMaker может возобновить их выполнение, используя последнюю контрольную точку модели. Благодаря SageMaker встроенные платформы и алгоритмы машинного зрения позволяют создавать периодические контрольные точки, которые можно также использовать для пользовательских моделей.

Вопрос. Нужно ли периодически создавать контрольные точки в процессе управляемого спотового обучения?

Рекомендуем периодически создавать контрольные точки при выполнении долгосрочных заданий по обучению. Это позволит предотвратить перезапуск заданий по управляемому спотовому обучению в случае освобождения ресурса. Если активировано использование контрольных точек, Amazon SageMaker возобновит выполнение задания по управляемому спотовому обучению с последней контрольной точки.

Вопрос. Как подсчитать снижение издержек в случае использования заданий по управляемому спотовому обучению?

После завершения задания по управляемому спотовому обучению можно посмотреть, сколько вы экономите, в Консоли управления AWS, а также рассчитать снижение издержек в процентном соотношении между длительностью выполнения задания по обучению и длительностью, указанной в счете.

Независимо от количества прерываний заданий по управляемому спотовому обучению, вы оплачиваете только длительность загрузки данных.

Вопрос. Какие инстансы можно использовать для управляемого спотового обучения?

Для управляемого спотового обучения можно использовать все инстансы, которые поддерживает Amazon SageMaker.

Вопрос. В каких регионах AWS поддерживается управляемое спотовое обучение?

Управляемое спотовое обучение поддерживается во всех регионах AWS, в которых на данный момент доступен Amazon SageMaker.

Вопрос. Существуют ли ограничения на размер пакета данных, который используется для обучения?

С Amazon SageMaker для обучения моделей можно использовать пакеты данных любого размера.

Вопрос. Какие источники данных можно легко добавить в Amazon SageMaker?

В момент создания задания по обучению можно указать местоположение данных для обучения в Amazon S3.

Вопрос. Какие алгоритмы Amazon SageMaker использует для создания моделей?

Amazon SageMaker предоставляет следующие встроенные алгоритмы: вычисление линейной регрессии, логической регрессии, кластеризация методом k-средних, анализ основного компонента, факторизация машин, тематическое нейронное моделирование, латентное размещение Дирихле, построение деревьев методом градиентного роста, алгоритм sequence2sequence, прогнозирование временных рядов, word2vec и классификация изображений. Также SageMaker поддерживает оптимизированные контейнеры Apache MXNet, Tensorflow, Chainer, PyTorch, Gluon, Keras, Horovod, Scikit-learn и Deep Graph Library. Кроме того, Amazon SageMaker поддерживает собственные алгоритмы обучения, предоставленные в образе Docker в соответствии с требованиями спецификации.

Вопрос. Что такое автоматическая настройка модели?

Большинство алгоритмов машинного обучения раскрывают множество параметров, которые контролируют работу базового алгоритма. Эти параметры носят название гиперпараметров, и их значения влияют на качество итоговых обученных моделей. Автоматическая настройка модели – это процесс поиска такого набора гиперпараметров алгоритма, который позволит получить оптимальную модель.

Вопрос. Какие модели поддаются автоматической настройке?

Автоматическую настройку модели можно запускать в Amazon SageMaker поверх любого алгоритма до тех пор, пока это возможно с научной точки зрения. В число возможных вариантов входят встроенные алгоритмы SageMaker, глубокие нейронные сети, а также любые произвольные алгоритмы, которые были импортированы в SageMaker в виде образов Docker.

Вопрос. Можно ли использовать автоматическую настройку модели за пределами Amazon SageMaker?

В настоящий момент это невозможно. Наибольшего эффекта от автоматической настройки модели можно добиться только в рамках Amazon SageMaker.

Вопрос. Какой базовый алгоритм лежит в основе механизма настройки?

В данный момент в качестве алгоритма для настройки гиперпараметров используется специальным образом настроенный алгоритм байесовской оптимизации. Его задача – оптимизировать в процессе настройки заданные пользователем объективные метрики. А точнее, он проверяет объективные метрики завершенных заданий по обучению и использует полученные результаты для изменения комбинации гиперпараметров для следующего задания по обучению.

Вопрос. Вы можете порекомендовать конкретные гиперпараметры, которые следует настроить?

Нет. Влияние различных гиперпараметров на поведение модели зависит от множества факторов. Из-за этого нельзя достоверно заявлять, что один из них важнее других и настраивать следует именно его. Для встроенных в Amazon SageMaker алгоритмов мы указываем, является ли тот или иной гиперпараметр настраиваемым.

Вопрос. Сколько времени занимает настройка гиперпараметров?

Продолжительность настройки гиперпараметров зависит от множества факторов, включая объем используемых данных, базовый алгоритм и значения гиперпараметров. Помимо этого пользователи имеют возможность выбрать количество одновременно выполняемых обучающих задач и их общее количество. Все эти факторы влияют на продолжительность настройки гиперпараметров.

Вопрос. Можно ли оптимизировать несколько целевых метрик по аналогии с моделями, чтобы они были одновременно и быстрыми, и точными?

В настоящий момент это невозможно. На данный момент пользователю необходимо указывать единственную целевую метрику для оптимизации или изменить код алгоритма таким образом, чтобы он порождал новую метрику, которая представляет собой среднее взвешенное между двумя и более полезными метриками. Процесс настройки необходимо будет оптимизировать в сторону этой целевой метрики.

Вопрос. Сколько стоит автоматическая настройка модели?

За саму настройку гиперпараметров плата не взимается. Плата начисляется за выполнение заданий по обучению, которые будут запущены процессом настройки гиперпараметров, согласно ценам на обучение моделей.

Вопрос. Как выбрать между Amazon SageMaker Autopilot и автоматической настройкой параметров?

Amazon SageMaker Autopilot автоматизирует все задачи, входящие в типичный рабочий поток машинного обучения, такие как предварительная обработка компонентов, выбор алгоритма и настройка гиперпараметров, уделяя особое внимание примерам использования классификации и регрессии. Автоматическая настройка модели, в свою очередь, предназначена для настройки моделей независимо от их базовой структуры: встроенные алгоритмы, платформы глубокого обучения или настраиваемые контейнеры. В качестве платы за гибкость применения вам придется вручную выбрать определенный алгоритм, гиперпараметры для настройки и диапазоны поиска.

Вопрос. Что такое стимулированное обучение?

Стимулированное обучение — это техника машинного обучения, позволяющая агенту учиться в интерактивной среде методом проб и ошибок, используя обратную связь по своим действиям и взаимодействиям.

Вопрос. Можно ли обучать модели стимулированного обучения в Amazon SageMaker?

Да. В Amazon SageMaker можно обучать не только контролируемые и неконтролируемые модели, но и модели стимулированного обучения.

Вопрос. Чем стимулированное обучение отличается от контролируемого обучения?

Несмотря на то что и в контролируемом, и в стимулированном обучении используется сопоставление входных и выходных данных, в отличие от контролируемого обучения, где агенту в качестве обратной связи предоставляется набор шагов для выполнения задачи, в стимулированном обучении используется обратная связь с задержкой, когда поощрительные сигналы оптимизируются для достижения долгосрочной цели посредством выполнения последовательности действий.

Вопрос. В каких случаях следует использовать стимулированное обучение?

В то время как целью техник, используемых в контролируемом обучении, является поиск правильного ответа на основе существующих в учебных данных шаблонов, техники неконтролируемого обучения преследуют цель найти сходства и различия между точками данных. Техники стимулированного обучения, в отличие от этого, призваны научить, как достичь нужного результата даже, когда не совсем понятно, что следует для этого делать. Следовательно, стимулированное обучение больше подходит для обеспечения работы интеллектуальных приложений, когда агент может принимать автономные решения: робототехника, автоматизированные транспортные средства, системы отопления, вентиляции и кондиционирования воздуха, промышленные системы контроля и управления и многое другое.

Вопрос. Какой тип сред можно использовать для обучения моделей стимулированного обучения?

Система стимулированного обучения Amazon SageMaker поддерживает несколько разных сред для обучения соответствующих моделей. Можно использовать такие сервисы AWS, как AWS RoboMaker, среды с открытым исходным кодом или пользовательские среды, разработанные с помощью интерфейсов Open AI Gym, а также коммерческие среды моделирования, такие как MATLAB и SimuLink.

Вопрос. Нужно ли создавать собственные алгоритмы для агентов стимулированного обучения, чтобы обучать соответствующие модели?

Нет, система стимулированного обучения Amazon SageMaker включает наборы инструментов для стимулированного обучения, такие как Coach и Ray RLLib, предлагающие реализации алгоритмов для агентов стимулированного обучения (DQN, PPO, A3C и многие другие).

Вопрос. Можно ли использовать собственные библиотеки и реализации алгоритмов стимулированного обучения в системе стимулированного обучения Amazon SageMaker?

Да, вы можете использовать собственные библиотеки и реализации алгоритмов стимулированного обучения, помещенные в контейнеры Docker, в системе стимулированного обучения Amazon SageMaker.

Вопрос. Можно ли выполнять распределенные развертывания с помощью системы стимулированного обучения Amazon SageMaker?

Да. Можно даже выбрать гетерогенный кластер, где обучение проходит в инстансе графического процессора, а моделирование — в нескольких инстансах ЦП.

Развертывание моделей

Вопрос. Что такое Amazon SageMaker Model Monitor?

Amazon SageMaker Model Monitor позволяет разработчикам обнаруживать и устранять концептуальное отклонение. SageMaker Model Monitor автоматически обнаруживает концептуальные отклонения в развернутых моделях и выдает подробные оповещения, которые помогают определить источник проблемы. Все модели, прошедшие обучение в SageMaker, автоматически генерируют основные метрики, которые можно собирать и просматривать в SageMaker Studio. Внутри SageMaker Studio можно настроить собираемые данные, способы их просмотра и ситуации, которые будут генерировать отправку оповещений.

Вопрос. Можно ли получить доступ к инфраструктуре, на которой работает Amazon SageMaker?

Нет. Amazon SageMaker управляет вычислительной инфраструктурой от имени клиента, что позволяет выполнять проверку работоспособности, применять обновления безопасности и выполнять другие рутинные работы по обслуживанию. Кроме того, сервис дает возможность развертывать артефакты моделей обучения с собственным кодом логического вывода в своей среде хостинга.

Вопрос. Как увеличить размер и производительность модели Amazon SageMaker, запущенной в рабочей среде?

Хостинг Amazon SageMaker автоматически масштабирует производительность на основании потребностей приложения, используя Application Auto Scaling. Сервис также позволяет вручную изменить количество и тип инстансов при редактировании конфигурации адреса, не останавливая работу системы.

Вопрос. Как выполнять мониторинг Amazon SageMaker в рабочей среде?

Amazon SageMaker отправляет метрики производительности в Amazon CloudWatch. Это позволяет отслеживать метрики, устанавливать предупреждения и автоматически реагировать на изменения в рабочем трафике. Кроме того, Amazon SageMaker записывает журналы в Amazon CloudWatch Logs, что дает возможность отслеживать и устранять проблемы рабочего развертывания.

Вопрос. Какие модели можно разместить с помощью Amazon SageMaker?

Amazon SageMaker может разместить любую модель, которая соответствует задокументированной спецификации для образов Docker, используемых для логического вывода. Сюда входят модели, созданные из артефактов моделей Amazon SageMaker и кода логического вывода.

Вопрос. Какое количество одновременных запросов API в режиме реального времени поддерживает Amazon SageMaker?

Amazon SageMaker рассчитан на масштабирование для обеспечения большого количества транзакций в секунду. Точное количество определяется конкретной моделью, а также количеством и типом инстансов, на которых выполнено развертывание.

Вопрос. Что такое пакетное преобразование?

Пакетное преобразование позволяет выполнять прогнозирование на основе крупных или малых пакетов данных. Вам не придется разбивать набор данных на несколько фрагментов или управлять адресами реального времени. С помощью простого API можно запрашивать прогнозы для большого количества записей данных, а затем быстро и просто преобразовывать данные.

Вопрос. Что такое Amazon SageMaker Edge Manager?

Amazon SageMaker Edge Manager — это функция Amazon SageMaker, которая упрощает оптимизацию, защиту, мониторинг и обслуживание моделей машинного обучения на большом числе периферийных устройств (интеллектуальные камеры, роботы, персональные компьютеры и мобильные устройства). SageMaker Edge Manager помогает разработчикам машинного обучения работать с моделями ML на множестве периферийных устройств в любом масштабе.

Вопрос. Как начать работу с SageMaker Edge Manager?

Для начала работы с SageMaker Edge Manager вам нужно скомпилировать и упаковать обученные модели машинного обучения для использования в облаке, зарегистрировать устройства и подготовить их с помощью SageMaker Edge Manager SDK. Для подготовки модели к развертыванию SageMaker Edge Manager компилирует модель для целевого периферийного оборудования с помощью SageMaker Neo. Когда завершится компиляция модели, SageMaker Edge Manager подписывает ее ключом, созданным в AWS, а затем создает готовый к развертыванию пакет, содержащий модель, необходимую среду выполнения и учетные данные. На стороне устройства необходимо выполнить регистрацию в SageMaker Edge Manager, затем загрузить SageMaker Edge Manager SDK и выполнить инструкции по установке агента SageMaker Edge Manager на каждом из устройств. Обучающий блокнот содержит пример с пошаговым описанием для процесса подготовки моделей и подключения к периферийным устройствам с помощью SageMaker Edge Manager.

Вопрос. Какие устройства поддерживает SageMaker Edge Manager?

Amazon SageMaker Edge Manager поддерживает устройства на базе наиболее распространенных ЦП (ARM, x86) и графических процессоров (ARM, Nvidia) с операционными системами Linux и Windows. Со временем функциональные возможности SageMaker Edge Manager будут дополнены для поддержки дополнительных встраиваемых процессоров и мобильных платформ, которые уже поддерживаются в SageMaker Neo.

Вопрос. Нужно ли использовать Amazon SageMaker для обучения модели, чтобы применить Amazon SageMaker Edge Manager?

Нет, не нужно. Вы можете обучить свои модели любым другим способом или выбрать предварительно обученную моделью из открытого источника или от любого поставщика моделей.

Вопрос. Нужно ли использовать Amazon SageMaker Neo для компиляции модели, чтобы применить Amazon SageMaker Edge Manager?

Да, нужно. Amazon SageMaker Neo преобразует и скомпилирует модели в исполняемые фалы, которые вы сможете легко упаковать и развернуть на периферийных устройствах. После развертывания пакета модели агент Amazon SageMaker Edge Manager распакует его и запустит модель на устройстве.

Вопрос. Как выполняется развертывание модели на периферийных устройствах?

Amazon SageMaker Edge Manager сохраняет пакет модели в указанной вами корзине Amazon S3. Вы можете использовать возможность обновления по беспроводной сети (OTA), предоставляемую сервисом AWS IoT Greengrass, или любой другой механизм развертывания, чтобы развернуть пакет модели из корзины S3 на устройства.

Вопрос. Чем Amazon SageMaker Edge Manager SDK отличается от среды выполнения SageMaker Neo (dlr)?

Neo dlr представляет собой среду выполнения с открытым исходным кодом, которая выполняет только модели, скомпилированные в сервисе Amazon SageMaker Neo. В отличие от dlr с открытым исходным кодом, пакет SageMaker Edge Manager SDK содержит агент устройства корпоративного уровня, который обеспечивает дополнительные возможности для безопасности, управления моделями и обслуживания моделей. SageMaker Edge Manager SDK подходит для развертывания продукта в большом масштабе.

Вопрос. Как Amazon SageMaker Edge Manager связан с AWS IoT Greengrass?

Amazon SageMaker Edge Manager и AWS IoT Greengrass могут совместно работать в вашем решении для Интернета вещей. Упаковав модель машинного обучения с помощью SageMaker Edge Manager, вы сможете применить возможность обновления по беспроводной сети AWS IoT Greengrass для развертывания пакета модели на устройствах. AWS IoT Greengrass позволяет удаленно отслеживать устройства Интернета вещей, а SageMaker Edge Manager помогает контролировать и поддерживать модели ML на этих устройствах.

Вопрос. Как Amazon SageMaker Edge Manager связан с AWS Panorama? В каких случаях следует использовать Amazon SageMaker Edge Manager, а в каких — AWS Panorama?

AWS предлагает самые широкие и глубокие возможности для запуска моделей на периферийных устройствах. У нас есть сервисы для поддержки широкого набора сценариев использования, включая машинное зрение, распознавание голоса и профилактическое обслуживание.

Если ваша компания собирается применять машинное зрение на камерах и других периферийных устройствах, вы можете использовать AWS Panorama. Panorama предоставит готовые к развертыванию приложения машинного зрения для периферийных устройств. Чтобы начать работу с AWS Panorama, достаточно лишь войти в облачную консоль, указать нужную модель для Amazon S3 или SageMaker, а затем реализовать бизнес-логику в формате скрипта Python. AWS Panorama скомпилирует эту модель для целевого устройства и создаст пакет приложения, который вы сможете всего в несколько щелчков мыши развернуть на соответствующих устройствах. Кроме того, независимые поставщики ПО смогут создать собственные приложения на основе AWS Panorama SDK, а Device SDK позволит производителям устройств сертифицировать свои устройства для работы с AWS Panorama.

Клиенты, которым нужны собственные модели или более детальный контроль за признаками модели, могут воспользоваться Amazon SageMaker Edge Manager. Управляемый сервис SageMaker Edge Manager позволяет подготавливать, выполнять, контролировать и обновлять модели машинного обучения на большом числе периферийных устройств (интеллектуальные камеры, динамики, роботы и т. п.) для использования таких возможностей, как обработка естественного языка, обнаружение мошенничества и профилактическое техническое обслуживание. SageMaker Edge Manager предназначен для разработчиков машинного обучения для периферийных устройств, которым нужен более полный контроль за моделями, например для создания собственных признаков или отслеживания отклонений. Любой разработчик машинного обучения для периферийных устройств может работать с SageMaker Edge Manager через консоль SageMaker и SageMaker API. SageMaker Edge Manager позволяет применить всю мощь SageMaker для создания, обучения моделей и их развертывания на периферийных устройствах через облако.

Вопрос. В каких регионах AWS доступен Amazon SageMaker Edge Manager?

Amazon SageMaker Edge Manager доступен в 6-ти регионах AWS: Восток США (Сев. Вирджиния), Восток США (Огайо), Запад США (Орегон), ЕС (Ирландия), ЕС (Франкфурт) и Азия и Тихий океан (Токио). Подробнее см. в таблице регионов AWS.

Вопрос. Что такое Amazon SageMaker Neo?

Amazon SageMaker Neo позволяет обучить модели машинного обучения однократно, а затем запускать их где угодно в облаке и на периферии. SageMaker Neo автоматически оптимизирует модели, созданные на базе популярных платформ глубокого обучения, которые можно использовать для развертывания на нескольких аппаратных платформах. Оптимизированные модели выполняются до 25 раз быстрее и потребляют менее десятой части ресурсов по сравнению со стандартными моделями машинного обучения.

Вопрос. Как начать работу с Amazon SageMaker Neo?

Чтобы начать работу с Amazon SageMaker Neo, необходимо войти на консоль Amazon SageMaker, выбрать обученную модель, составить модели, следуя примеру, а затем развернуть полученную модель на целевой аппаратной платформе.

Вопрос. Каковы основные компоненты Amazon SageMaker Neo?

Amazon SageMaker Neo состоит из двух основных компонентов: компилятора и среды выполнения. Во-первых, компилятор Neo считывает модели, экспортированные разными платформами. Затем он преобразует функции и операции платформы в промежуточное представление, которое не зависит от платформы. Затем компилятор выполняет серию оптимизаций, создает двоичный код для оптимизированных операций и записывает их в общую библиотеку объектов. Компилятор также сохраняет определение и параметры модели в отдельные файлы. Во время выполнения среда выполнения Neo загружает артефакты, созданные компилятором: определение модели, параметры, а также общую библиотеку объектов для выполнения модели.

Вопрос. Требуется ли использовать Amazon SageMaker для обучения модели, чтобы применить Amazon SageMaker Neo для преобразования модели?

Нет. Для обученных в любом месте моделей можно применить Neo, чтобы оптимизировать их для инстансов машинного обучения Amazon SageMaker или устройств с поддержкой AWS IoT Greengrass.

Вопрос. Какие модели поддерживает Amazon SageMaker Neo?

В настоящее время Amazon SageMaker Neo поддерживает наиболее популярные модели машинного обучения, которые лежат в основе приложений компьютерного зрения, и наиболее популярные модели дерева принятия решений, которые сегодня используются в Amazon SageMaker. Neo оптимизирует производительность моделей AlexNet, ResNet, VGG, Inception, MobileNet, SqueezeNet и DenseNet, обученных в MXNet и TensorFlow, а также обученных в XGBoost моделей классификации и моделей на основе алгоритма Random Cut Forest.

Вопрос. Какие аппаратные платформы поддерживает Amazon SageMaker Neo?

Списки поддерживаемых облачных инстансов, периферийных устройств и версий платформ можно найти в документации по Amazon SageMaker Neo.

Вопрос. В каких регионах AWS доступен Amazon SageMaker Neo?

Список поддерживаемых регионов вы найдете в таблице регионов AWS.

Тарифы Amazon SageMaker Savings Plan

Вопрос: Что такое тарифы Amazon SageMaker Savings Plan?

Amazon SageMaker Savings Plans – это гибкая модель ценообразования на основе использования для Amazon SageMaker, применяемая при условии, что клиент обязуется использовать постоянный объем вычислительных ресурсов (измеряемый в USD/час) на протяжении одного года или трех лет. Amazon SageMaker Savings Plan – это самый гибкий вариант, помогающий экономить до 64 %. Эти тарифы автоматически применяются к соответствующим инстансам SageMaker ML, включая SageMaker Studio Notebook, SageMaker On-Demand Notebook, SageMaker Processing, SageMaker Data Wrangler, SageMaker Training, SageMaker Real-Time Inference и SageMaker Batch Transform, независимо от семейства инстансов, размера и региона. Например, для обработки рабочих нагрузок, связанных с получением логических выводов, вместо инстанса ml.c5.xlarge, работающего в регионе Восток США (Огайо), можно в любое время перейти к использованию инстанса ml.Inf1 в регионе Запад США (Орегон) и автоматически продолжать пользоваться тарифами Savings Plan.

Вопрос:В каких случаях рекомендуется использовать Amazon SageMaker Savings Plan?

Если вы с определенной частотой (измеряемой в USD в час) используете инстансы Amazon SageMaker и несколько компонентов SageMaker или ожидаете, что ваша конфигурация (например, семейство инстансов, регион) будет со временем меняться, тарифы SageMaker Savings Plan позволят вам получить максимальную экономию при одновременном обеспечении гибкости изменения конфигурации базовых технологий с учетом потребностей приложений и внедрения инноваций. Тарифы Savings Plan применяется автоматически ко всем подходящим инстансам машинного обучения без какого-либо ручного вмешательства.

Вопрос. Как начать работу с тарифами Amazon SageMaker Savings Plan?

Тарифы Savings Plan можно подключить в AWS Cost Explorer на консоли управления или с помощью API либо командной строки. Пользуясь рекомендациями в AWS Cost Explorer, вы без труда выберете оптимальные обязательства по Savings Plan, чтобы добиться максимальной экономии средств. Рекомендуемые почасовые обязательства основаны на вашей истории использования ресурсов по требованию и личном выборе типа плана, срока действия и способа оплаты. После регистрации плана оплаты по схеме Savings Plan плата за использование вычислительных ресурсов автоматически станет начисляться в соответствии со льготными ценами этого плана, а превышение выбранного объема будет оплачиваться по тарифам схемы по требованию.

Вопрос: Чем отличаются тарифы Savings Plan для Amazon SageMaker от Compute Savings Plans для EC2?

Разница между тарифами Savings Plan для Amazon SageMaker и EC2 заключается в перечне поддерживаемых ими сервисов. Тарифы SageMaker Savings Plan применяются только к использованию инстансов машинного обучения SageMaker.

Вопрос: Как тарифы Savings Plan работают с AWS Organizations и консолидированной оплатой?

Тарифы Savings Plan можно приобрести в любом аккаунте группы AWS Organization и консолидированной оплаты. По умолчанию экономия, предоставляемая тарифами Savings Plan, распространяется на все аккаунты в рамках группы AWS Organization и консолидированной оплаты. Однако вы также можете ограничить действие тарифов Savings Plan только аккаунтом, в котором они были приобретены.

Подробнее о ценах на Amazon SageMaker

Перейти на страницу цен
Готовы начать?
Регистрация
Есть вопросы?
Свяжитесь с нами