Вопросы и ответы о машинном обучении для геопространственных данных с Amazon SageMaker

Вопрос. Что такое геопространственные данные?

Геопространственные данные представляют собой особенности или объекты на земной поверхности. Первый тип геопространственных данных – векторные данные, которые используют двумерную геометрию, такую как точки, линии или многоугольники для представления таких объектов, как дороги и границы земельных участков. Данные о местоположении с геометками также считаются векторными данными. Они включают в себя достопримечательности – например, Эйфелеву башню – в постах социальных сетей с метками местоположения, координаты широты и долготы или различные стили и форматы адресов улиц. Второй тип геопространственных данных – это растровые данные, такие как снимки, собранные спутниками, воздушными платформами или платформами дистанционного зондирования. Этот тип данных использует матрицу пикселей для определения местоположения объектов. Растровые форматы можно использовать для хранения данных, которые меняются.

Вопрос. Как я могу получить геопространственные данные?

Геопространственные возможности Amazon SageMaker позволяют использовать геопространственные данные, такие как Landsat 8 и Sentinel-2. Вы также можете импортировать собственные данные, включая данные о местоположении, полученные с помощью GPS-устройств, подключенных автомобилей или датчиков Интернета вещей (IoT), посещаемость розничных магазинов, геомаркетинговые данные и данные переписи населения, а также данные, полученные от сторонних поставщиков. Геопространственные возможности SageMaker также помогают обогатить эти данные с помощью специально разработанных функций Службы определения местоположения Amazon, таких как преобразование широты и долготы местоположения в адреса улиц.

Вопрос. Что такое геопространственные возможности SageMaker?

Геопространственные возможности SageMaker упрощают специалистам по работе с данными и инженерам по машинному обучению (ML) создание, обучение и развертывание моделей машинного обучения для составления прогнозов с использованием геопространственных данных. Вы можете предоставить свои собственные данные, например, спутниковые данные Planet Labs из Amazon S3, или получить данные из сервиса Open Data в AWS, Службы определения местоположения Amazon и других источников геопространственных данных SageMaker.

Вопрос. Как повысить эффективность работы с помощью геопространственных возможностей SageMaker?

Вы можете упростить предварительную обработку данных с помощью встроенных геопространственных операций, таких как сопоставление карт. Ускорьте разработку геопространственных моделей машинного обучения и уменьшите общую стоимость владения, используя одну из готовых моделей или разрабатывая собственные геопространственные модели ML. Вы можете визуализировать прогнозы, наложенные на карту, с помощью встроенных инструментов визуализации, которые позволяют ускорить совместную работу.

Вопрос. Зачем мне использовать возможности геопространственного машинного обучения в SageMaker?

Вы можете использовать возможности геопространственного машинного обучения в SageMaker, чтобы делать прогнозы на геопространственных данных быстрее, чем решения «сделай сам». Геопространственные возможности SageMaker облегчают доступ к геопространственным данным из существующих озер данных, наборов данных с открытым исходным кодом и других источников геопространственных данных SageMaker. Геопространственные возможности SageMaker минимизируют необходимость создания пользовательской инфраструктуры и функций предварительной обработки данных, предлагая специально разработанные алгоритмы для эффективной подготовки данных, обучения моделей и выводов. Вы также можете создавать пользовательские визуализации и данные и обмениваться ими со своей организацией из Студии Amazon SageMaker. Геопространственные возможности SageMaker включают предварительно обученные модели для общего использования в сельском хозяйстве, недвижимости, страховании и финансовых услугах.