Общие вопросы

Вопрос. Что такое Amazon Rekognition?

Amazon Rekognition представляет собой сервис, позволяющий легко добавить в приложения мощные инструменты для анализа изображений. Rekognition Image позволяет быстро и легко создавать мощные приложения для поиска, проверки и упорядочивания миллионов изображений. Rekognition Video позволяет получать из сохраненного или потокового видео контекст, учитывающий движение, и анализировать данные.

Rekognition Image представляет собой сервис для анализа изображений, который способен распознавать объекты, сцены и лица, извлечь текст, распознать знаменитостей и выявить неуместное содержимое в изображениях. Этот сервис также дает возможность искать и сопоставлять лица. Rekognition Image основан на проверенной технологии глубокого обучения с возможностью масштабирования, разработанной экспертами Amazon в области компьютерного зрения. Этот сервис позволяет ежедневно анализировать в Prime Photos миллиарды изображений.

Rekognition Image использует модели глубоких нейронных сетей для распознавания и маркировки тысяч объектов и сцен, при этом мы постоянно добавляем новые маркеры и возможности для распознавания лиц. При использовании Rekognition Image вы платите только за анализируемые изображения и хранимые метаданные о лицах.

Rekognition Video – сервис распознавания видеоматериалов, который способен обнаруживать те или иные действия, определять движения людей в кадре, распознавать объекты и знаменитостей, а также выявлять неприемлемое содержимое в видеозаписях, сохраненных в Amazon S3, и видеопотоках Acuity. Rekognition Video позволяет обнаруживать людей и отслеживать их перемещения на видеозаписи, когда они входят в сцену или выходят из нее, даже если лица не видны. Например, этот сервис можно использовать в приложении, которое отправляет оповещения в режиме реального времени, как только кто-нибудь оставит посылку возле вашей двери. Сервис Rekognition Video индексирует метаданные (объекты, действия, сцены, лица и знаменитости), существенно упрощая процедуру поиска по видеозаписи.

Вопрос. Что такое глубокое обучение?

Глубокое обучение – это подраздел машинного обучения и важная область исследований искусственного интеллекта. Цель глубокого обучения – выделение абстракций высокого уровня из несортированных данных с помощью глубоких графов с разными уровнями вычислений, которые представляют собой множество линейных и нелинейных трансформаций. Глубокое обучение основано на общих моделях обработки информации и связей в человеческом мозге. Оно позволяет перейти от запрограммированных вручную функций к новым, обнаруженным в результате обработки очень больших массивов неструктурированных данных. Обучение представляет собой итеративную оценку сотен тысяч параметров в глубоком графе с помощью эффективных алгоритмов.

Ряд архитектур глубокого обучения, таких как сверточные глубокие нейросети (CNN) и рекуррентные нейросети, уже используется в компьютерном зрении, распознавании речи, обработке естественной речи и распознавании звука и показывает блестящие результаты при выполнении различных заданий.

Amazon Rekognition входит в семейство сервисов Amazon AI. Сервисы Amazon AI используют глубокое обучение для распознавания изображений, превращения текста в естественную речь и создания интуитивных интерфейсов живого текстового и голосового взаимодействия.

Вопрос. Требует ли работа с Amazon Rekognition опыта в области глубокого обучения?

Нет. Пользователям Amazon Rekognition не требуется разрабатывать, поддерживать и развивать конвейеры глубокого обучения.

Чтобы грамотно решать задачи из области компьютерного зрения, такие как обнаружение объектов и сцен или анализ и распознавание лиц, системы глубокого обучения должны быть грамотно настроены и обучены на огромных массивах данных с заведомо верными маркировками. Создание, очистка и маркировка исходных данных – это дорогая и трудоемкая работа. Более того, само обучение глубокой нейросети требует огромных вычислительных ресурсов и специального оборудования на базе графических процессоров (GPU).

Amazon Rekognition – полностью управляемый сервис, он уже обучен выполнению задач в области распознавания изображений и видеозаписей, так что пользователю не нужно расходовать время и ресурсы на создание собственных конвейеров глубокого обучения. Amazon Rekognition продолжает интегрировать последние научные разработки и новые исходные данные в свою нейросеть для повышения точности ее работы. Это позволяет пользователям полностью сосредоточиться на проектировании и разработке важных и нужных приложений.

Вопрос. Каковы наиболее распространенные примеры использования Amazon Rekognition?

К наиболее распространенным примерам использования Amazon Rekognition можно отнести следующие.

  • Библиотека изображений с функцией поиска
  • Проверка пользователя по лицу
  • Анализ эмоций
  • Распознавание лиц
  • Модерация изображений

К наиболее распространенным примерам использования Rekognition Video можно отнести следующие.

  • Индексация видеоархивов для упрощения поиска
  • Удобная фильтрация видеозаписей на основании наличия контента для взрослых или подозрительного контента

Вопрос. Как начать работу с Amazon Rekognition?  

Если вы еще не зарегистрировались в сервисе Amazon Rekognition, можно щелкнуть кнопку «Попробовать Amazon Rekognition» на странице сервиса Amazon Rekognition и завершить процесс регистрации. Вам потребуется аккаунт Amazon Web Services. Если такового еще нет, аккаунт будет предложено создать во время регистрации в сервисе. Войдя в систему, можно попробовать Amazon Rekognition на собственных изображениях и видеозаписях через консоль управления Amazon Rekognition или загрузить SDK Amazon Rekognition и начать разработку собственных приложений. Подробную информацию см. в пошаговом Руководстве по началу работы.

Вопрос. Какие API предлагает Amazon Rekognition? 

Сервис Amazon Rekognition Image предлагает API для распознавания объектов и сцен, распознавания и анализа лиц, распознавания знаменитостей, выявления неприемлемого содержимого, сравнения и поиска похожих лиц в коллекции и API для управления ресурсами. Rekognition Image также предоставляет API для сравнения лиц и извлечения текста, в то время как Rekognition Video предлагает API для отслеживания людей и управления потоковым видео Acuity. Подробности см. в справке по API Amazon Rekognition.

Вопрос. Какие форматы изображений и видеозаписей поддерживает Amazon Rekognition? 

В настоящее время Amazon Rekognition поддерживает графические форматы JPEG и PNG. Изображения передаются в сервис как объекты S3 или массивы байтов. Amazon Rekognition Video может анализировать видеозаписи, сохраненные в корзинах Amazon S3. Кодирование видео должно быть выполнено с использованием кодека H.264. Поддерживаются следующие форматы видеофайлов: MPEG-4 и MOV. Кодек представляет собой программное или аппаратное обеспечение, которое выполняет сжатие данных для более быстрой их передачи и последующее восстановление данных в исходном виде. Кодек H.264 чаще всего используется для записи, сжатия и рассылки видеозаписей. Формат видеофайла может содержать один или несколько кодеков. Если видеофайл в формате MOV или MPEG-4 не поддерживается в Rekognition Video, убедитесь в том, что для кодирования видео использован кодек H.264.

Вопрос. Какие размеры файлов поддерживает Amazon Rekognition? 

Amazon Rekognition Image поддерживает изображения в виде объектов S3 размером до 15 МБ и в виде массивов байтов размером до 5 МБ. Amazon Rekognition Video поддерживает видеофайлы размером до 8 ГБ и продолжительностью до 2 часов в виде файла S3.

Вопрос. Как разрешение изображения влияет на точность результата при использовании API Rekognition Image? 

Amazon Rekognition работает с самыми разными разрешениями изображений. Для достижения наилучших результатов рекомендуется использовать разрешение VGA (640x480) или выше. При использовании изображений с разрешением QVGA (320x240) и ниже повышается вероятность ошибок при распознавании лиц, объектов или неприемлемого контента, однако Amazon Rekognition может работать с изображениями размером от 80 пикселей в длину/ширину.

Вопрос. Насколько мелкими могут быть объекты для распознавания и анализа в Amazon Rekognition Image? 

Рекомендуется отправлять на распознавание изображения, в которых наименьший объект или лицо занимает не менее 5 % размера меньшей стороны изображения (в пикселях). Например, на изображении с разрешением 1600x900 наименьший объект или лицо должны занимать не менее 45 пикселей по каждой стороне.

Вопрос. Как разрешение видео влияет на точность результата при использовании API в Rekognition Video? 

Система обучена распознавать лица размером свыше 32 пикселей (по короткой стороне). То есть минимальный размер лица, которое может распознавать система, варьируется примерно от 1/7 (разрешение QVGA) до 1/30 (разрешение HD 1080p) короткой стороны экрана. Например, для экранов с разрешением VGA точность распознавания лиц, размер которых меньше 1/10 короткой стороны экрана, будет снижена.

Вопрос. Какие еще факторы могут влиять на качество работы API в Rekognition Video? 

Помимо разрешения, качество работы API также может зависеть от четкости, скорости движения и позы человека, освещения.

Вопрос. Какие пользовательские видеозаписи лучше всего подходят для работы API Rekognition Video? 

Этот API демонстрирует лучшие результаты при использовании любительских и профессиональных видеозаписей с фронтальной съемкой при стандартном освещении и цветовом окружении. Этот API не тестировался в применении к черно-белым записям, записям в инфракрасном спектре, а также при слишком ярком или слишком скудном освещении. В приложениях, чувствительных к ложноположительным срабатываниям, рекомендуется удалить результаты, для которых уровень уверенности не достигает установленного (для конкретного приложения) значения.

Вопрос. В каких регионах AWS доступен Amazon Rekognition? 

Сервис Amazon Rekognition Image в настоящее время доступен в регионах Восток США (Северная Вирджиния), Запад США (Орегон), Восток США (Огайо), ЕС (Ирландия), Азия и Тихий океан (Токио), Азия и Тихий океан (Сидней) и AWS GovCloud (США). Сервис Amazon Rekognition Video доступен в регионах Восток США (Северная Вирджиния), Запад США (Орегон), Восток США (Огайо), ЕС (Ирландия), Азия и Тихий океан (Токио), Азия и Тихий океан (Сидней). Сервис Amazon Rekognition Video для потоковой передачи в реальном времени доступен только в регионах Восток США (Северная Вирджиния), Запад США (Орегон), ЕС (Ирландия), Азия и Тихий океан (Токио).

Обнаружение объектов и сцен

Вопрос. Что такое метка?

Метка – это объект, сцена или образ, обнаруженный на изображении в качестве содержимого. Например, фотография отдыхающих на тропическом пляже может содержать метки «человек», «вода», «песок», «пальма», «купальник» (объекты), «пляж» (сцена) и «природа» (образ). 

Вопрос. Что такое уровень уверенности и как его использовать?

Уровень уверенности – это число в промежутке между от 0 до 100, отражающее вероятность правильности выдвинутого предположения. Если в примере выше процедура определения объектов и сцен вернет метку «вода» с уровнем уверенности 99 и метку «пальма» с уровнем уверенности 35, то на изображении, скорее всего, есть вода, но нет пальмы.

В приложениях, для которых критически важно отсутствие ошибок определения (ложных срабатываний), рекомендуется использовать только метки с уровнем уверенности выше определенного порогового значения. Оптимальное пороговое значение зависит от приложения. Во многих случаях можно добиться оптимального качества работы для конечного пользователя, установив пороговое значение уровня уверенности выше заданного по умолчанию.

Вопрос. Что такое обнаружение объектов и сцен?  

Обнаружение объектов и сцен – это процедура анализа изображения или видеозаписи и назначения им меток на основании визуального содержимого. Amazon Rekognition Image выполняет эту процедуру посредством API DetectLabels.Данный API позволяет автоматически распознавать тысячи объектов, сцен и образов с указанием уровня уверенности для каждой метки. При использовании DetectLabels пороговое значение уровня уверенности по умолчанию равняется 50. Обнаружение объектов и сцен подходит для клиентов, заинтересованных в структуризации больших библиотек изображений и поиску по ним. Это могут быть потребительские приложения и приложения-ассистенты, которые полагаются на создаваемый пользователями контент, а также технологические рекламные агентства, заинтересованные в развитии своих алгоритмов целевого обращения.

Вопрос. Какие типы меток поддерживает Amazon Rekognition?

Rekognition поддерживает тысячи меток из стандартных категорий. В качестве примеров можно привести следующие.

  • Люди и события: «свадьба», «невеста», «ребенок», «торт на день рождения», «гитарист» и т. д.
  • Еда и напитки: «яблоко», «сэндвич», «вино», «торт», «пицца» и т. д.
  • Природа: «пляж», «горы», «озеро», «закат», «радуга» и т. д.
  • Животные: «собака», «кошка», «лошадь», «тигр», «черепаха» и т. д.
  • Дом и сад: «кровать», «стол», «двор», «люстра», «спальня» и т. д.
  • Спорт и отдых: «гольф», «баскетбол», «хоккей», «теннис», «туризм» и т. д.
  • Растения и цветы: «роза», «тюльпан», «пальма», «лес», «бамбук» и т. д.
  • Искусство и развлечения: «скульптура», «картина», «гитара», «балет», «мозаика» и т. д.
  • Транспорт: «самолет», «автомобиль», «велосипед», «мотоцикл», «грузовой автомобиль» и т. д.
  • Техника: «компьютер», «мобильный телефон», «видеокамера», «телевизор», «наушники» и т. д.

Вопрос. Чем обнаружение объектов и сцен отличается от анализа видео?

Rekognition Video позволяет автоматически выявлять тысячи различных объектов (например, транспортных средств или домашних питомцев) и действий (танцы, вечеринка), присваивая каждой метке временную метку и уровень уверенности. Сервис также использует контекст из видеозаписи, учитывающий движения и время, для точной идентификации сложных действий (например, «задувание свечи» или «тушение пожара»).

Вопрос. Не могу найти нужную метку. Как подать запрос на добавление новой метки?

Отправить соответствующий запрос можно через службу поддержки клиентов AWS. Каталог меток Amazon Rekognition постоянно пополняется новыми метками на основании отзывов клиентов.

Обнаружение подозрительного контента

Вопрос. Что такое обнаружение подозрительного контента?

Обнаружение подозрительного контента в Amazon Rekognition – это простой в использовании API, основанный на технологии глубокого обучения и предназначенный для обнаружения явного контента для взрослых и подозрительного контента на изображениях. Разработчики могут использовать эти дополнительные метаданные для фильтрации неприемлемого контента в зависимости от потребностей своего бизнеса. Помимо маркировки изображения на основе наличия контента для взрослых, модерация изображений также возвращает иерархический список меток с уровнями уверенности. Эти метки указывают на определенную категорию контента для взрослых, что предоставляет разработчикам возможности более точной фильтрации и управления большим объемом контента, создаваемым пользователями (UGC). Этот API можно использовать в процессах модерации для таких приложений, как социальные сети и сайты знакомств, платформы для обмена фотографиями, блоги и форумы, приложения для детей, сайты интернет-коммерции, развлекательные сервисы и сервисы интернет-рекламы.

Вопрос. Какие типы явного контента для взрослых и подозрительного контента позволяет обнаружить Amazon Rekognition?

Amazon Rekognition позволяет обнаружить следующие типы явного контента для взрослых и подозрительного контента на изображениях.

  • Явную наготу:
  • обнаженное тело;
  • графическое изображение обнаженного мужского тела;
  • графическое изображение обнаженного женского тела;
  • действие сексуального характера;
  • частично обнаженное тело.
  • Подозрительный контент:
  • женский купальник или нижнее белье;
  • мужские плавки или нижнее белье;
  • откровенную одежду.

API обнаружения подозрительного контента в изображениях Amazon Rekognition возвращает иерархический список меток, а также уровни уверенности для каждой обнаруженной метки. Например, для определенного неприемлемого изображения Rekognition может вернуть тип «явная нагота» и дать оценку, соответствующую максимальному уровню уверенности. Разработчики могут просто использовать этот результат, чтобы пометить контент. В том же ответе Rekognition возвращает и второй уровень детализации, предоставляя дополнительную характеристику, например, «графическое изображение обнаженного мужского тела», для которой также указывается уровень уверенности. Разработчики могут использовать эту информацию для создания более сложных алгоритмов фильтрации.

Обратите внимание на то, что API обнаружения подозрительного контента в изображениях не является авторитетным источником и не претендует на роль исчерпывающего фильтра явного контента для взрослых и подозрительного контента. Кроме того, этот API не определяет, содержит ли изображение запрещенный контент (например, детскую порнографию) или контент для взрослых с элементами извращений.

Вопрос. Может ли API обнаружения подозрительного контента в изображениях Amazon Rekognition обнаруживать другой неприемлемый контент, кроме явного контента для взрослых и подозрительного контента?

В настоящее время Rekognition поддерживает только метки, которые были описаны выше. Мы будем работать над тем, чтобы постоянно добавлять и улучшать метки, используя отзывы наших клиентов.
Если вам требуется выявлять другие типы неприемлемого контента на изображениях, свяжитесь с нами с помощью обратной связи, описанной далее в этом разделе.

Вопрос. Чем обнаружение подозрительного контента отличается от анализа видео?

Rekognition Video позволяет автоматически выявлять контент для взрослых или подозрительный контент, а также присваивает каждой метке содержимого временную метку и уровень точности.

Вопрос. Как можно убедиться в том, что Rekognition будет нормально работать в моем примере использования модерации изображений и видео для взрослых?

Модели обнаружения подозрительного контента в изображениях в Rekognition были тщательно настроены и протестированы, но мы рекомендуем проверить точность оценки на собственных наборах данных.

Можно использовать параметр «MinConfidence» в запросах API, чтобы найти баланс между обнаружением контента (отзывом) и правильностью обнаружения (точностью). Если уменьшить значение параметра «MinConfidence», скорее всего, будет обнаружена большая часть подозрительного контента, но в эту категорию также может быть включен контент, который на самом деле не относится к явному контенту для взрослых и подозрительному контенту. Если увеличить значение параметра «MinConfidence», скорее всего, вы будете уверены, что весь обнаруженный контент на самом деле относится к явному контенту для взрослых и подозрительному контенту, но при этом некоторое неприемлемое содержимое может быть не помечено. Примеры использования параметра «MinConfidence» для модерации изображений см. в документации по ссылке.

Если Rekognition не может обнаружить контент для взрослых на изображениях или видеозаписях, свяжитесь с нами, используя описанную ниже процедуру обратной связи.

Вопрос. Как можно оставить отзыв о работе Rekognition для улучшения алгоритма обнаружения подозрительного контента? 

Отправить соответствующий запрос можно через службу поддержки клиентов AWS. Amazon Rekognition постоянно расширяет типы обнаруживаемого неприемлемого контента, используя отзывы клиентов. Обычно для добавления новых типов явного контента для взрослых или подозрительного контента требуется 6–8 недель. Обратите внимание на то, что запрещенный контент (такой как детская порнография) не будет принят в рамках этой процедуры.

Анализ лиц

Вопрос. Что такое анализ лиц?

Анализ лиц – это процесс определения лиц на изображениях и сбора характерных атрибутов этих лиц. Amazon Rekognition Image добавляет рамку для каждого лица, обнаруженного на изображении, присваивая ему такие атрибуты, как пол, наличие солнцезащитных очков и пометки элементов лица. Rekognition Video присваивает лицам, обнаруженным в видеозаписях, временные метки, а также добавляет данные о расположении, рамку и помечает элементы лица.

Вопрос. Какие характеристики лиц возвращает Amazon Rekognition?

Amazon Rekognition возвращает следующие характеристики для обнаруженных лиц (с рамками и уровнем уверенности для каждого атрибута):

  • пол,
  • улыбка,
  • эмоции,
  • очки,
  • солнцезащитные очки,
  • открытые глаза,
  • открытый рот,
  • усы,
  • борода,
  • положение,
  • качество,
  • элементы лица.

Вопрос. Что такое положение лица?

Положение лица отражает угол наклона обнаруженного лица по трем осям. Каждый параметр принимает значение от -180 до +180 градусов. При помощи положения лица можно определить ориентацию полигона лица (а не просто прямоугольной рамки), замерить деформацию, корректно отслеживать лица и т. д.

Вопрос. Что такое качество лица?

Качество лица отражает качество обнаруженного изображения лица по двум параметрам: четкость и яркость. Оба параметра представляют собой значения в промежутке от 0 до 1. Установив пороговое значение для этих параметров, можно отфильтровывать только хорошо освещенные и четкие лица. Это может быть полезно в приложениях, для которых важно качество изображений лиц, например в решениях для сравнения и распознавания лиц.

Вопрос. Что такое элементы лица?  

Элементы лица – это набор выступающих точек, обычно включающий в себя уголки, края или центры ключевых частей лица, таких как глаза, нос и рот. API DetectFaces сервиса Amazon Rekognition возвращает наборы элементов лиц, по которым можно обрезать лица, сливать их друг с другом, накладывать пользовательские маски, создавать фильтры и т. д.

Вопрос. Сколько лиц может быть обнаружено на изображении?

Сервис Amazon Rekognition может обнаружить на одном изображении до 100 лиц.

Вопрос. Чем анализ лица отличается от анализа видео?

Rekognition Video позволяет находить в видеозаписях лица и анализировать их характеристики (например, улыбается ли человек на изображении, открыты ли у него глаза, какие эмоции проявляются). Rekognition Video снабжает все обнаруженные лица временными метками, а также добавляет данные о расположении, рамку и помечает элементы лица (левый глаз, правый глаз, нос, левый угол рта, правый угол рта). Данные о расположении и времени можно использовать, чтобы отслеживать, как меняются эмоции на лице со временем, а также для использования дополнительных функциональных возможностей (автоматическое добавление рамки для лица, выделение или обрезка).

Вопрос. Какие факторы, помимо разрешения видео, могут повлиять на качество работы API Rekognition Video?

Помимо разрешения видео, на работу API также существенно влияет качество лиц и их типичность (в рамках коллекций лиц, используемых для поиска). Если для распознавания лица используются различные ракурсы и вариации, например борода, очки, различные позы (в профиль и анфас), это позволит значительно повысить производительность. Как правило, качество снижается, если человек на записи очень быстро движется или видео слишком нечеткое.

Сравнение лиц

Вопрос. Что такое сравнение лиц? 

Сравнение лиц – это процедура сравнения конкретного лица с одним или несколькими другими и измерение значения сходства. API CompareFaces сервиса Amazon Rekognition Image позволяет измерить вероятность того, что два лица на разных изображениях принадлежат одному и тому же человеку. API сравнивает лица, обнаруженные на исходном и целевом изображениях, и возвращает значение сходства для каждой пары. Сервис также возвращает рамку и уровень уверенности для каждого обнаруженного лица. Сравнение лиц можно использовать для идентификации пользователей по сохраненным ранее фотографиям практически в режиме реального времени.

Вопрос. Можно ли использовать исходное изображение, на котором больше одного лица? 

Да. Если на исходном изображении больше одного лица, CompareFaces выберет самое большое лицо и сравнит его с каждым лицом на целевом изображении.

Вопрос. Со сколькими лицами можно сравнить одно лицо?

Одно лицо с исходного изображения можно сравнить не более чем с 15 лицами, обнаруженными на целевом изображении.

Распознавание лиц

Вопрос. Что такое распознавание лиц?

Распознавание лиц – это процесс идентификации или проверки пользователя путем поиска его лица в коллекции лиц. С помощью распознавания лиц можно легко разработать процедуры для многофакторной аутентификации банковских платежей, автоматического пропуска сотрудников в здание и другие решения.

Вопрос. Что такое коллекция лиц и как ее создать?

Коллекция лиц – это используемый и управляемый пользователем индекс векторных данных о лицах с возможностью поиска. API CreateCollection позволяет создать коллекцию лиц в поддерживаемом регионе AWS и получить соответствующее имя ресурса Amazon (ARN). Каждой коллекции присваивается уникальный идентификационный номер CollectionId.

Вопрос. Как добавлять лица в коллекцию и удалять их?  

Для добавления лица в существующую коллекцию используется API IndexFaces. Данный API принимает изображение в виде объекта S3 или массива байтов и добавляет векторные представления обнаруженных лиц в коллекцию лиц. IndexFaces также возвращает уникальный идентификационный номер FaceId и рамку лица для каждого добавленного лица.

Для удаления лица из существующей коллекции используется API DeleteFaces. Данный API открывает существующую коллекцию лиц (на основании параметра CollectionId) и удаляет указанные лица в соответствии с параметрами FaceId. Подробнее о добавлении и удалении лиц см. в примере Managing Collections.

Вопрос. Как выполнить поиск лица в коллекции?  

В индексированной коллекции лиц можно выполнять поиск по изображению (SearchFaceByImage) и по FaceId (SearchFaces). Данные API принимают на вход лицо и возвращают набор похожих лиц в порядке убывания значения сходства. Подробнее см. в примере Поиск лиц.

Вопрос. Чем распознавание лиц отличается от анализа видео?

Rekognition Video позволяет в режиме реального времени выполнять поиск лиц в коллекциях, которые содержат несколько десятков миллионов лиц. Сначала необходимо создать коллекцию лиц, в которой будут храниться векторные представления особенностей лиц. Затем сервис Rekognition выполнит поиск в коллекции лиц, чтобы найти лица, которые имеют визуальное сходство с лицами людей на видеозаписи. Для каждого совпадения Rekognition выводит уровень уверенности, что позволяет указывать в приложении наиболее вероятные варианты.

Вопрос. Какие факторы, помимо разрешения видео, могут повлиять на качество работы API Video?

Помимо разрешения видео, на работу API также существенно влияет качество лиц и их типичность (в рамках коллекций лиц, используемых для поиска). Если для распознавания лица используются различные ракурсы и вариации, например борода, очки, различные позы (в профиль и анфас), это позволит значительно повысить производительность. Как правило, если человек на записи движется слишком быстро, его лицо будет трудно распознать. Кроме того, качество результатов также снижается, если видео недостаточно четкое.

Распознавание знаменитостей

Вопрос. Что такое распознавание знаменитостей?

Распознавание знаменитостей в Amazon Rekognition выполняется с помощью простого в использовании API на базе глубокого обучения. Данный API предназначен для обнаружения и распознавания знаменитых, примечательных или выдающихся в своей области людей. API RecognizeCelebrities был создан для работы в любом масштабе и предназначен для распознавания знаменитостей в нескольких категориях, таких как политика, спорт, бизнес, развлечения и средства массовой информации. Функция распознавания знаменитостей идеально подходит для клиентов, которым нужно индексировать библиотеки цифровых изображений и искать в них знаменитостей, исходя из их конкретных интересов.

Вопрос. Кого можно идентифицировать с помощью API распознавания знаменитостей?

Amazon Rekognition может идентифицировать только тех знаменитостей, на распознавание которых была проведена тренировка модели глубокого обучения. Обратите внимание, что API RecognizeCelebrities не претендует на представление исчерпывающего списка знаменитостей. Эта возможность была разработана с целью охватить как можно больше знаменитостей, исходя из потребностей и отзывов наших клиентов. Мы постоянно добавляем новые имена, но тот факт, что Celebrity Recognition не распознает некоторых людей, которые могут считаться знаменитыми другими организациями или нашими клиентами, не отражает нашего мнения об их статусе как знаменитостей. Если вы хотите, чтобы возможность распознавания знаменитостей распознавала и других известных людей, присылайте свои предложения.

Вопрос. Может ли знаменитость, идентифицируемая через запрос API Amazon Rekognition, потребовать удаления себя из списка знаменитостей, с которым работает эта возможность?

Да. Если знаменитость хочет быть удаленной из списка знаменитостей, с которым работает эта возможность, он или она может отправить электронное письмо в службу поддержки AWS, и мы выполним удаление.

Вопрос. Из каких источников предоставляется дополнительная информация о знаменитости?

Для предоставления дополнительной информации о знаменитости в рамках ответа API использует специальный список источников. В настоящее время мы предоставляем URL-адрес IMDB, когда таковой доступен. Мы можем добавить другие источники в будущем.

Вопрос. Чем распознавание знаменитостей отличается от анализа видео? 

Сервис Rekognition Video позволяет обнаруживать и распознавать все появления известных людей в видеозаписи. Результат с временным кодом предоставляет имя и уникальный ID знаменитости, рамку лица, уровень уверенности и URL-адреса, указывающие на связанный контент для знаменитости, например ссылку на рейтинг IMDB. Распознавание знаменитостей также возможно даже в том случае, если лицо в видеозаписи скрыто. Эта функция позволяет индексировать библиотеки цифровых видеозаписей и выполнять в них поиск практических примеров использования, соответствующих конкретным целям рекламной или маркетинговой кампании.

Вопрос. Какие факторы, помимо разрешения видео, могут повлиять на качество работы API Rekognition Video? 

Если знаменитость на видеозаписи движется слишком быстро или видео имеет недостаточную четкость, это может отрицательно сказаться на качестве работы API Rekognition Video. Кроме того, яркий макияж и одежда, которые часто используют актеры и актрисы, также может повлиять на качество.

Text in Image

Вопрос. Что представляет собой возможность Text in Image? 

Text in Image – это функциональная возможность Amazon Rekognition, которая позволяет обнаруживать и распознавать текст на изображениях, например названия улиц, надписи, названия продуктов и номерные знаки автомобилей. Возможность Text in Image создана именно для работы с изображениями физических объектов, а не документов. API DetectText сервиса Amazon Rekognition обрабатывает изображение и возвращает текстовую метку и рамку, а также уровень уверенности для каждой обнаруженной строки символов. Таким образом, в приложениях для обмена фотографиями и приложениях социальных сетей можно, к примеру, обеспечить возможность визуального поиска на основе индекса изображений, содержащих одни и те же текстовые метки. В мультимедийных и развлекательных приложениях можно создать текстовые метаданные для видеокадров, чтобы обеспечить поиск релевантного контента, например новостей, результатов спортивных соревнований, рекламных роликов и титров. В приложениях для обеспечения безопасности и наблюдения можно идентифицировать транспортные средства, распознавая номерные знаки на изображениях, получаемых с нагрудных или дорожных камер.

Вопрос. Текст какого типа поддерживается возможностью Text in Image сервиса Amazon Rekognition? 

Возможность Text in Image создана именно для работы с изображениями физических объектов, а не документов. Она обеспечивает распознавание цифр и текста на основе латиницы с поддержкой разнообразных оформлений, шрифтов и стилей, а также вариантов расположения текста на объектах различной ориентации, включая вывески и плакаты. Text in Image распознает до 50 цепочек символов в одном изображении и перечисляет их как слова и строки. Следует отметить, что Text in Image распознает только горизонтальный текст с ориентацией +/- 30 градусов.

Вопрос. Как можно оставить отзыв о работе Rekognition для улучшения распознавания текста?

Отправить соответствующий запрос можно через службу поддержки клиентов AWS. Amazon Rekognition постоянно добавляет новые типы распознаваемого текстового контента, используя отзывы клиентов.

Анализ видео

Вопрос. Как работает асинхронный API Amazon Rekognition Video? 

Rekognition Video обрабатывает видеозапись, сохраненную в корзине Amazon S3. Проектная модель представляет собой асинхронный набор операций. Для запуска анализа видео запускается операция Start (например, StartLabelDetection). Статус выполнения запроса публикуется в разделе Amazon Simple Notification Service. Для получения статуса выполнения запроса в разделе Amazon SNS можно использовать очередь Amazon Simple Queue Service или функцию AWS Lambda. После получения статуса выполнения запроса можно вызвать операцию Get (например, GetLabelDetection), чтобы просмотреть результаты обработки запроса.

 

Вопрос. Что такое отслеживание людей? 

Сервис Rekognition Video позволяет отслеживать всех людей в кадре, а также в различных кадрах видеозаписи. Rekognition Video умеет распознавать людей, даже когда камера находится в движении. Для каждого обнаруженного лица добавляется рамка, а также атрибуты лица и временные метки. В приложениях для розничной торговли этот сервис позволяет формировать оперативные аналитические данные о клиентах (например, перемещения клиентов по проходам в торговом центре или время ожидания в очереди на кассе).

Вопрос. Как выполнить анализ видеозаписей в режиме реального времени?  

В режиме потоковой передачи можно в режиме реального времени выполнять поиск лиц по коллекции, которая содержит десятки миллионов лиц. Функция распознавания лиц и API распознавания лиц Rekognition Video поддерживают полноценную интеграцию с потоками Amazon Kinesis Video Streams – служба, с помощью которой разработчики могут передавать данные и связанные с ними метаданные по тысячам каналов. Для приложений системы безопасности сервис обеспечивает возможность быстрого и эффективного выявления лиц, находящихся в оперативной разработке, в режиме реального времени.

Вопрос. Поддерживает ли Amazon Rekognition Video работу с потоками Amazon Kinesis Video Streams? 

Rekognition Video использует поток видеоданных Kinesis в качестве входных данных для обработки потока. В результате анализа выходные данные Rekognition Video передаются в поток данных Kinesis, после чего считываются клиентским приложением. Rekognition Video предоставляет процессор для обработки потоковых данных, который можно использовать для запуска анализа потока видеоданных и управления им. Дополнительные сведения см. в разделе Работа с потоковыми данными.

Оплата

Вопрос. Как Amazon Rekognition учитывает количество обработанных изображений?

Для всех API, получающих на входе изображения, количеством обработанных изображений считается фактическое количество проанализированных изображений. К этой категории относятся API DetectLabels, DetectModerationLabels, DetectFaces, IndexFaces, RecognizeCelebrities и SearchFaceByImage. Для API CompareFaces, которому на вход подаются два изображения, учитывается только обработка исходного изображения.

Для API, которые не получают на входе изображения, количеством обработанных изображений считается количество вызовов API. К этой категории принадлежат API SearchFaces и ListFaces.

Вызовы остальных API Amazon Rekognition (DeleteFaces, CreateCollection, DeleteCollection, и ListCollections) не учитываются при подсчете обработанных изображений.

Вопрос. Как Amazon Rekognition учитывает продолжительность обработанных видеозаписей в минутах?

Архивные видеозаписи: сервис Amazon Rekognition подсчитывает продолжительность видеозаписи (в минутах), обработанных API, и суммирует полученные значения для выставления счетов. Потоки видеоданных в реальном времени оплачиваются из расчета количества обработанных пакетов по пять секунд.

Вопрос. За использование каких API Amazon Rekognition взимается плата?

Оплачиваются следующие API Amazon Rekognition Image: DetectLabels, DetectModerationLabels, DetectFaces, IndexFaces, RecognizeCelebrities, SearchFaceByImage, CompareFaces, SearchFaces и ListFaces. Плата за использование сервиса Amazon Rekognition Video формируется, исходя из продолжительности видеозаписи (в минутах), успешно обработанных API StartLabelDetection, StartFaceDetection, StartFaceDetection, SatrtContentModeration, StartPersonTracking, StartCelebrityRecognition, StartFaceSerach и StartStreamProcessor.

Вопрос. Сколько стоит использование сервиса Amazon Rekognition?

Актуальную информацию о ценах см. на странице цен на Amazon Rekognition.

Вопрос. Взимается ли плата за хранение векторных отображений лиц в коллекциях?

Да. За хранение векторных отображений лиц взимается плата в размере 0,01 USD за 1000 лиц в месяц. Подробнее см. на странице цен.

Вопрос. Распространяется ли уровень бесплатного пользования AWS на Amazon Rekognition?

Да. В рамках уровня бесплатного пользования AWS можно начать работу с Amazon Rekognition бесплатно. После регистрации новым пользователям Amazon Rekognition доступен анализ до 5000 изображений в месяц в течение первых 12 месяцев. В рамках уровня бесплатного пользования также можно бесплатно использовать API Amazon Rekognition и хранить до 1000 лиц. Кроме того, для клиентов Amazon Rekognition Video доступен бесплатный анализ 1000 минут видео в месяц в течение первого года использования.

Вопрос. Ваши цены указаны с учетом налогов?

Подробнее о налогах см. на странице Справка по налогам при работе с Amazon Web Services.

Интеграция с сервисами AWS

Вопрос. Поддерживает ли Amazon Rekognition Video работу с изображениями, хранящимися в Amazon S3?

Да. Чтобы начать анализировать изображения на Amazon S3, достаточно указать API Amazon Rekognition на корзину S3. Данные никуда перемещать не нужно. Подробнее о работе с объектами S3 и API Amazon Rekognition см. в упражнении по определению меток.

Вопрос. Можно ли использовать Amazon Rekognition для анализа изображений, которые хранятся в корзине Amazon S3 в другом регионе?

Нет. Убедитесь, что корзина Amazon S3, которую вы хотите использовать, находится в том же регионе, что и ваш адрес API Amazon Rekognition.

Вопрос. Как можно пакетно обрабатывать множество изображений в Amazon Rekognition?

Для пакетной обработки изображений из Amazon S3 следуйте шагам, описанным в примере пакетной обработки изображений Amazon Rekognition на GitHub.

Вопрос. Как использовать AWS Lambda с Amazon Rekognition?

Amazon Rekognition поддерживает эффективное взаимодействие с AWS Lambda и позволяет реализовать в хранилищах данных AWS, таких как Amazon S3 и Amazon DynamoDB, анализ изображений в ответ на события. Чтобы начать использовать Amazon Rekognition вместе с AWS Lambda, выполните шаги, описанные здесь, и выберите схему, предложенную сервисом Amazon Rekognition.

Вопрос: Работает ли Amazon Rekognition с AWS CloudTrail?

Да. Amazon Rekognition поддерживает запись в файлы журнала CloudTrail в качестве событий для следующих действий: CreateCollection, DeleteCollection, CreateStreamProcessor, DeleteStreamProcessor, DescribeStreamProcessor, ListStreamProcessors и ListCollections. Подробнее о вызовах API Amazon Rekognition, интегрированных с AWS CloudTrail, см. в разделе «Logging Amazon Rekognition API Calls with AWS CloudTrail».

Конфиденциальность данных

Вопрос. Сохраняются ли данные изображений и видеозаписей, обработанных Amazon Rekognition, и как они используются в AWS?

Сервис Amazon Rekognition может хранить и использовать обрабатываемые изображения и видеозаписи исключительно в целях предоставления и поддержки сервиса, а также развития и улучшения качества Amazon Rekognition и других технологий машинного обучения и искусственного интеллекта Amazon. Использование контента необходимо для постоянного совершенствования интерфейса Amazon Rekognition, включая разработку, настройку и обучение соответствующих технологий. Мы не используем информацию в контенте, идентифицирующую личности пользователей, чтобы предлагать рекламу продуктов и услуг конечным пользователям. Доверие клиентов, конфиденциальность и безопасность их контента являются главными приоритетами компании. Мы применяем соответствующие комплексные технические и физические средства контроля (включая шифрование хранимых и передаваемых данных), предназначенные для предотвращения неавторизованного доступа к данным и контенту клиентов или их раскрытия, и гарантируем, что использование этих данных соответствует нашим обязательствам перед клиентами. Подробные сведения см. на странице https://aws.amazon.com/compliance/data-privacy-faq/.

Вопрос. Можно ли удалять данные изображений и видеозаписей, сохраненные Amazon Rekognition?

Да. Удаление изображений и видеозаписей, связанных с аккаунтом клиента, можно запросить, связавшись со службой поддержки AWS Support. Удаление изображений и видеозаписей может отрицательно сказаться на работе Amazon Rekognition.

Вопрос. У кого есть доступ к моему контенту, который обрабатывается и хранится Amazon Rekognition?

Доступ к контенту клиентов, который обрабатывается и хранится сервисом Amazon Rekognition, имеют исключительно авторизованные сотрудники. Доверие клиентов, конфиденциальность и безопасность их контента являются главными приоритетами компании. Мы применяем надежные комплексные технические и физические средства контроля, включая шифрование, чтобы предотвратить несанкционированный доступ к данным и контенту клиентов, и гарантируем, что использование этих данных соответствует нашим обязательствам перед клиентами. Подробные сведения см. на странице https://aws.amazon.com/compliance/data-privacy-faq/.

Вопрос. Буду ли я по-прежнему владельцем контента, который обрабатывается и хранится сервисом Amazon Rekognition?

Пользователь сохраняет все права владения своим контентом. Мы используем контент только с согласия пользователя.

Вопрос. Выходит ли контент, обрабатываемый сервисом Amazon Rekognition, за границу той области AWS, в которой пользователь использует Amazon Rekognition?

Весь контент, который обрабатывается сервисом Amazon Rekognition, шифруется и сохраняется в той области AWS, в которой вы используете Amazon Rekognition. Определенная часть контента, обрабатываемая Amazon Rekognition, может храниться в другой области AWS, однако это служит исключительно целям постоянного развития и совершенствования интерфейса Amazon Rekognition и других технологий машинного обучения и искусственного интеллекта Amazon. Удаление изображений и видеозаписей, связанных с аккаунтом клиента, можно запросить, связавшись со службой поддержки AWS Support. Доверие клиентов, конфиденциальность и безопасность их контента являются главными приоритетами компании. Мы применяем надежные комплексные технические и физические средства контроля, включая шифрование, чтобы предотвратить несанкционированный доступ к данным и контенту клиентов, и гарантируем, что использование этих данных соответствует нашим обязательствам перед клиентами. Подробные сведения см. на странице https://aws.amazon.com/compliance/data-privacy-faq/.

Вопрос. Можно ли использовать Amazon Rekognition вместе с веб-сайтами, программами или другими приложениями, которые ориентированы на детей в возрасте до 13 лет и подпадают под действие Закона о защите конфиденциальности детей в Интернете (COPPA)?

Да. При условии соблюдения условий использования Amazon Rekognition, согласившись с которыми, вы обязались предоставлять любые необходимые предупреждения и получать любое требуемое согласие родителей, поддающееся проверке, в рамках COPPA, вы можете использовать Amazon Rekognition вместе с веб-сайтами, программами или другими приложениями, которые целиком или частично ориентированы на детей в возрасте до 13 лет.

Вопрос. Как можно определить, распространяется ли действие COPPA на мой веб-сайт, программу или приложение?

Для получения информации о требованиях COPPA и инструкциях по определению того, распространяются ли требования COPPA на конкретный веб-сайт, программу или другое приложение, обратитесь непосредственно к ресурсам, предоставляемым и поддерживаемым Федеральной торговой комиссией США. На указанном сайте также содержится информация о том, как определить, ориентирован ли сервис полностью или частично на детей в возрасте до 13 лет.

Вопрос: Соответствует ли сервис Amazon Rekognition требованиям HIPAA?

Сервис Amazon Rekognition соответствует требованиям HIPAA и подпадает под действие договора делового партнерства AWS (AWS BAA). Если организация заключила с AWS договор BAA, сервис Amazon Rekognition будет использовать, раскрывать и хранить закрытую медицинскую информацию организации (PHI) только в соответствии с условиями договора AWS BAA.

Контроль доступа

Вопрос. Как управлять доступом к Amazon Rekognition?

Сервис Amazon Rekognition интегрирован с AWS Identity and Access Management (IAM).Политики AWS IAM позволяют предоставить доступ к API Amazon Rekognition только определенному кругу авторизованных пользователей. Подробнее см. на странице аутентификации и контроля доступа к Amazon Rekognition.

Подробнее о ценах на Amazon Rekognition

Перейти на страницу цен
Готовы приступить к разработке?
Начать работу с AWS Rekognition
Есть вопросы?
Свяжитесь с нами