Amazon Rekognition. Часто задаваемые вопросы: AWS

Общие вопросы

Вопрос. Что такое Amazon Rekognition?

Amazon Rekognition представляет собой сервис, позволяющий легко добавить в приложения мощные инструменты для анализа изображений. Rekognition Image позволяет быстро и легко создавать мощные приложения для поиска, проверки и упорядочивания миллионов изображений. Rekognition Video позволяет получать из сохраненного или потокового видео контекст, учитывающий движение, и анализировать данные.

Rekognition Image – это сервис распознавания изображений, который определяет объекты, сцены, действия, ориентиры, лица, доминирующие цвета и качество изображения. Rekognition Image также извлекает текст, распознает знаменитостей и определяет неприемлемый контент на изображениях. Этот сервис также дает возможность искать и сравнивать лица.

Rekognition Video – сервис распознавания видеоматериалов, который способен обнаруживать те или иные действия, определять движения людей в кадре, распознавать объекты и знаменитостей, а также выявлять неприемлемое содержимое в видеозаписях, сохраненных в Amazon S3 и в потоках видео в реальном времени. Rekognition Video позволяет обнаруживать людей и отслеживать их перемещения на видеозаписи, когда они входят в сцену или выходят из нее, даже если лица не видны. Например, этот сервис можно использовать в приложении, которое отправляет оповещения в режиме реального времени, как только кто-нибудь оставит посылку возле вашей двери. Rekognition Video позволяет также индексировать метаданные, такие как объекты, действия, сцены, достопримечательности, знаменитости и лица, которые облегчают поиск видео.

Вопрос: Что такое глубокое обучение?

Глубокое обучение – это подраздел машинного обучения и важная область исследований искусственного интеллекта. Цель глубокого обучения – выделение абстракций высокого уровня из несортированных данных с помощью глубоких графов с разными уровнями вычислений, которые представляют собой множество линейных и нелинейных трансформаций. Глубокое обучение основано на общих моделях обработки информации и связей в человеческом мозге. Оно позволяет перейти от запрограммированных вручную функций к новым, обнаруженным в результате обработки очень больших массивов неструктурированных данных. Обучение представляет собой итеративную оценку сотен тысяч параметров в глубоком графе с помощью эффективных алгоритмов.

Ряд архитектур глубокого обучения, таких как сверточные глубокие нейросети (CNN) и рекуррентные нейросети, уже используется в компьютерном зрении, распознавании речи, обработке естественной речи и распознавании звука и показывает блестящие результаты при выполнении различных заданий.

Amazon Rekognition входит в семейство сервисов Amazon AI. Сервисы Amazon AI используют глубокое обучение для распознавания изображений, превращения текста в естественную речь и создания интуитивных интерфейсов живого текстового и голосового взаимодействия.

Вопрос. Требует ли работа с Amazon Rekognition опыта в области глубокого обучения?

Нет. Пользователям Amazon Rekognition не требуется разрабатывать, поддерживать и развивать конвейеры глубокого обучения.

Чтобы грамотно решать задачи из области компьютерного зрения, такие как обнаружение объектов и сцен или анализ и распознавание лиц, системы глубокого обучения должны быть грамотно настроены и обучены на огромных массивах данных с заведомо верными маркировками. Создание, очистка и маркировка исходных данных – это дорогая и трудоемкая работа. Более того, само обучение глубокой нейросети требует огромных вычислительных ресурсов и специального оборудования на базе графических процессоров (GPU).

Amazon Rekognition – полностью управляемый сервис, он уже обучен выполнению задач в области распознавания изображений и видеозаписей, так что пользователю не нужно расходовать время и ресурсы на создание собственных конвейеров глубокого обучения. Amazon Rekognition продолжает интегрировать последние научные разработки и новые исходные данные в свою нейросеть для повышения точности ее работы. Это позволяет пользователям полностью сосредоточиться на проектировании и разработке важных и нужных приложений.

Вопрос. Каковы наиболее распространенные примеры использования Amazon Rekognition?

К наиболее распространенным примерам использования Amazon Rekognition можно отнести следующие.

Библиотека изображений с функцией поиска
Проверка пользователя по лицу
Анализ эмоций
Распознавание лиц
Модерация изображений

К наиболее распространенным примерам использования Rekognition Video можно отнести следующие.

Индексация видеоархивов для упрощения поиска
Удобная фильтрация видеозаписей на основании наличия контента для взрослых или подозрительного контента

Вопрос. Как начать работу с Amazon Rekognition?

Если вы еще не зарегистрировались в сервисе Amazon Rekognition, можно нажать кнопку «Попробовать Amazon Rekognition» на странице сервиса Amazon Rekognition и завершить процесс регистрации. Вам потребуется аккаунт Amazon Web Services. Если такового еще нет, аккаунт будет предложено создать во время регистрации в сервисе. Войдя в систему, можно попробовать Amazon Rekognition на собственных изображениях и видеозаписях через консоль управления Amazon Rekognition или загрузить SDK Amazon Rekognition и начать разработку собственных приложений. Подробную информацию см. в пошаговом Руководстве по началу работы.

Вопрос. Какие форматы изображений и видеозаписей поддерживает Amazon Rekognition?

В настоящее время Amazon Rekognition поддерживает графические форматы JPEG и PNG. Изображения передаются в сервис как объекты S3 или массивы байтов. Amazon Rekognition Video может анализировать видеозаписи, сохраненные в корзинах Amazon S3. Кодирование видео должно быть выполнено с использованием кодека H.264. Поддерживаются следующие форматы видеофайлов: MPEG-4 и MOV. Кодек представляет собой программное или аппаратное обеспечение, которое выполняет сжатие данных для более быстрой их передачи и последующее восстановление данных в исходном виде. Кодек H.264 чаще всего используется для записи, сжатия и рассылки видеозаписей. Формат видеофайла может содержать один или несколько кодеков. Если видеофайл в формате MOV или MPEG-4 не поддерживается в Rekognition Video, убедитесь в том, что для кодирования видео использован кодек H.264.

Вопрос. Какие размеры файлов поддерживает Amazon Rekognition?

Amazon Rekognition Image поддерживает изображения в виде объектов S3 размером до 15 МБ и в виде массивов байтов размером до 5 МБ. Amazon Rekognition Video поддерживает видеофайлы размером до 10 ГБ и продолжительностью до 6 часов в виде файла S3.

Вопрос. Как разрешение изображения влияет на точность результата при использовании API Rekognition Image?

Amazon Rekognition работает с самыми разными разрешениями изображений. Для достижения наилучших результатов рекомендуется использовать разрешение VGA (640x480) или выше. При использовании изображений с разрешением QVGA (320x240) и ниже повышается вероятность ошибок при распознавании лиц, объектов или неприемлемого контента, однако Amazon Rekognition может работать с изображениями размером от 80 пикселей в длину/ширину.

Вопрос. Насколько мелкими могут быть объекты для распознавания и анализа в Amazon Rekognition Image?

Рекомендуется отправлять на распознавание изображения, в которых наименьший объект или лицо занимает не менее 5 % размера меньшей стороны изображения (в пикселях). Например, на изображении с разрешением 1600x900 наименьший объект или лицо должны занимать не менее 45 пикселей по каждой стороне.

Вопрос. Как поручить проверку прогнозов сервиса Amazon Rekognition людям?

Сервис Amazon Rekognition напрямую интегрирован с сервисом Amazon Augmented AI (Amazon A2I), поэтому вы можете легко направлять прогнозы с низким уровнем доверия из сервиса Amazon Rekognition Image на проверку людям. Используя API Amazon Rekognition для модерации контента или консоль Amazon A2I, вы можете указать условия, при которых сервис Amazon A2I будет направлять прогнозы рецензентам. В качестве такого условия можно использовать пороговое значение уровня доверия или процент случайной выборки. Если вы зададите пороговое значение уровня доверия, то на проверку людьми сервис Amazon A2I будет отправлять только те прогнозы, у которых уровень доверия ниже заданного значения. Значение уровня доверия можно изменить в любое время, чтобы добиться необходимого баланса между точностью и рентабельностью. Если же указать процент выборки, то на проверку людьми сервис Amazon A2I будет отправлять случайно выбранные прогнозы. Это поможет вам регулярно отслеживать точность прогнозов. Кроме того, веб-интерфейс Amazon A2I включает все указания и инструменты, необходимые рецензентам для выполнения проверок. Дополнительные сведения о том, как реализовать процесс проверки людьми с помощью сервиса Amazon Rekognition, см. на веб-странице Amazon A2I.

Вопрос. Как разрешение видео влияет на точность результата при использовании API в Rekognition Video?

Система обучена распознавать лица размером свыше 32 пикселей (по короткой стороне). То есть минимальный размер лица, которое может распознавать система, варьируется примерно от 1/7 (разрешение QVGA) до 1/30 (разрешение HD 1080p) короткой стороны экрана. Например, для экранов с разрешением VGA точность распознавания лиц, размер которых меньше 1/10 короткой стороны экрана, будет снижена.

Вопрос. Какие еще факторы могут влиять на качество работы API в Rekognition Video?

Помимо разрешения, качество работы API также может зависеть от четкости, скорости движения и позы человека, освещения.

Вопрос. Какие пользовательские видеозаписи лучше всего подходят для работы API Rekognition Video?

Этот API демонстрирует лучшие результаты при использовании любительских и профессиональных видеозаписей с фронтальной съемкой при стандартном освещении и цветовом окружении. Этот API не тестировался в применении к черно-белым записям, записям в инфракрасном спектре, а также при слишком ярком или слишком скудном освещении. В приложениях, чувствительных к ложноположительным срабатываниям, рекомендуется удалить результаты, для которых уровень уверенности не достигает установленного (для конкретного приложения) значения.

Вопрос. В каких регионах AWS доступен Amazon Rekognition?

Список всех регионов, в которых доступен Amazon Rekognition, см. в таблице регионов AWS.

Обнаружение меток

Вопрос. Что такое метка?

Метка – это объект, сцена или образ, обнаруженный на изображении в качестве содержимого. Например, фотография отдыхающих на тропическом пляже может содержать метки «человек», «вода», «песок», «пальма», «купальник» (объекты), «пляж» (сцена) и «природа» (образ).

Вопрос. Что такое уровень уверенности и как его использовать?

Уровень уверенности – это число в промежутке между от 0 до 100, отражающее вероятность правильности выдвинутого предположения. Если в примере выше процедура определения объектов и сцен вернет метку «вода» с уровнем уверенности 99 и метку «пальма» с уровнем уверенности 35, то на изображении, скорее всего, есть вода, но нет пальмы.

В приложениях, для которых критически важно отсутствие ошибок определения (ложных срабатываний), рекомендуется использовать только метки с уровнем уверенности выше определенного порогового значения. Оптимальное пороговое значение зависит от приложения. Во многих случаях можно добиться оптимального качества работы для конечного пользователя, установив пороговое значение уровня уверенности выше заданного по умолчанию.

Вопрос. Что такое обнаружение объектов и сцен?

Обнаружение объектов и сцен – это процедура анализа изображения или видеозаписи и назначения им меток на основании визуального содержимого. Amazon Rekognition Image выполняет эту процедуру посредством API DetectLabels. Данный API позволяет автоматически распознавать тысячи объектов, сцен и образов с указанием уровня уверенности для каждой метки. При использовании DetectLabels пороговое значение уровня уверенности по умолчанию равняется 50. Обнаружение объектов и сцен подходит для клиентов, заинтересованных в структуризации больших библиотек изображений и поиску по ним. Это могут быть потребительские приложения и приложения-ассистенты, которые полагаются на создаваемый пользователями контент, а также технологические рекламные агентства, заинтересованные в развитии своих алгоритмов целевого обращения.

Вопрос. Может ли Amazon Rekognition определять местоположение объектов и возвращать ограничительные рамки?

Да, Amazon Rekognition может определять местоположение многих распространенных объектов, таких как «человек», «автомобиль», «огнестрельное оружие» или «собака», как на изображениях, так и на видеозаписях. Вы получаете координаты ограничивающего прямоугольника для каждого экземпляра найденного объекта, а также уровень достоверности. Подробные сведения о структуре ответа API для ограничительных рамок объекта см. в документации.

Вопрос. Предоставляет ли Amazon Rekognition информацию о связи между обнаруживаемыми метками?

Да, для каждой найденной метки Amazon Rekognition возвращает родительские метки, псевдоним и категорию, если они существуют. Родительские метки возвращаются в соответствующее поле в иерархическом порядке. Первая родительская метка – это непосредственно родительская метка, а следующие – это родительские метки родительских меток. Например, при обнаружении объекта «Автомобиль» Amazon Rekognition возвращает две родительские метки: «Автомобиль» (родительская метка) и «Транспорт» (родительская метка более высокого порядка). Псевдонимы – это метки, имеющие то же значение, что и основные метки, и возвращаемые в поле «псевдонимы». Например, поскольку «сотовый телефон» является псевдонимом «мобильного телефона», Amazon Rekognition возвращает «сотовый телефон» в поле «псевдонимы» ярлыка «мобильный телефон». Категории группируют метки на основе общих тем и возвращают их в поле «категории». Например, поскольку «собака» является меткой в категории «Животные и домашние животные», Amazon Rekognition возвращает «Животные и домашние животные» в поле «категории» метки «собака». Более подробную информацию о полном списке поддерживаемых меток и их таксономии можно найти в документации по обнаружению меток Amazon Rekognition.

Вопрос. Какие типы меток поддерживает Amazon Rekognition?

Rekognition поддерживает тысячи меток из стандартных категорий. В качестве примеров можно привести следующие.

Люди и события: «свадьба», «невеста», «ребенок», «торт на день рождения», «гитарист» и т. д.
Еда и напитки: «яблоко», «сэндвич», «вино», «торт», «пицца» и т. д.
Природа: «пляж», «горы», «озеро», «закат», «радуга» и т. д.
Животные: «собака», «кошка», «лошадь», «тигр», «черепаха» и т. д.
Дом и сад: «кровать», «стол», «двор», «люстра», «спальня» и т. д.
Спорт и отдых: «гольф», «баскетбол», «хоккей», «теннис», «туризм» и т. д.
Растения и цветы: «роза», «тюльпан», «пальма», «лес», «бамбук» и т. д.
Искусство и развлечения: «скульптура», «картина», «гитара», «балет», «мозаика» и т. д.
Транспорт: «самолет», «автомобиль», «велосипед», «мотоцикл», «грузовой автомобиль» и т. д.
Техника: «компьютер», «мобильный телефон», «видеокамера», «телевизор», «наушники» и т. д.
Достопримечательности: Бруклинский мост, Колизей, Эйфелева башня, Мачу-Пикчу, Тадж-Махал и др.

Вопрос. Чем обнаружение объектов и сцен отличается для анализа видео?

Rekognition Video позволяет автоматически выявлять тысячи различных объектов (например, транспортных средств или домашних питомцев) и действий (танцы, вечеринка), присваивая каждой метке временную метку и уровень уверенности. Сервис также использует контекст из видеозаписи, учитывающий движения и время, для точной идентификации сложных действий (например, «задувание свечи» или «тушение пожара»).

Вопрос. Не могу найти нужную метку. Как подать запрос на добавление новой метки?

Отправьте нам запрос на обнаружение метки через консоль Amazon Rekognition, введя название метки в поле ввода в разделе «Поиск всех меток» и нажав «Запросить Rekognition для обнаружения» запрашиваемой метки. Каталог меток Amazon Rekognition постоянно пополняется новыми метками на основании отзывов клиентов.

Вопрос. Что такое свойства изображений?

Свойства изображения – это функция изображений Amazon Rekognition для определения доминирующих цветов и качества изображения. Свойства изображений определяют доминирующие цвета всего изображений, переднего плана изображений, фона изображений и объектов с локализованными ограничивающими рамками. Свойства изображений также измеряют качество изображений с помощью показателей яркости, резкости и контрастности. Для обнаружения меток свойства изображений можно вызвать через API DetectLabels, используя IMAGE_PROPERTIES в качестве входного параметра, с входным параметром GENERAL_LABEL или без него. Чтобы узнать больше, ознакомьтесь с документацией по обнаружению меток Amazon Rekognition.

Вопрос. Как определяются доминирующие цвета?

Свойства изображений возвращают доминирующие цвета в четырех форматах: RGB, hexcode, CSS color и упрощенные цвета. Amazon Rekognition сначала определяет доминирующие цвета по процентному содержанию пикселей, а затем сопоставляет эти цвета со 140 цветовыми палитрами CSS, RGB, шестнадцатеричным кодом и 12 упрощенными цветами (т. е. "зеленый", "розовый", "черный", "красный", "желтый", "голубой", "коричневый", "оранжевый", "белый", "фиолетовый", "синий", "серый"). По умолчанию функция свойств изображений возвращает десять (10) доминирующих цветов, если клиент не укажет количество возвращаемых цветов. Максимальное количество доминирующих цветов, которое может вернуть API, равно 12.

Вопрос. Как интерпретировать показатели яркости, резкости и контрастности?

Свойства изображений предоставляет значение от 0 до 100 для каждого показателя яркости, резкости и контрастности. Например, недоэкспонированное изображение получит низкую оценку яркости, а ярко освещенное изображение – высокую.

Вопрос. Как проверить, обновил ли Amazon Rekognition свои модели?

Amazon Rekognition возвращает параметр LabelModelVersion, который позволяет узнать, была ли обновлена модель. Модели обнаружения объектов и сцен часто обновляются на основе отзывов клиентов.

Amazon Rekognition Custom Labels

Вопрос. Можно ли использовать Custom Labels для анализа лиц, настраиваемого обнаружения текста?

Нет. Сервис Custom Labels предназначен для поиска объектов и сцен в изображениях. Custom Labels не предназначается для анализа лиц, настраиваемого обнаружения текста. Для этих задач следует использовать другие API Rekognition. Сведения о функциях анализа лиц и обнаружения текста см. в документации.

Вопрос. Можно ли использовать Custom Labels для поиска небезопасных изображений?

Да. Сервис Custom Labels предназначен для поиска объектов и сцен в изображениях. Custom Labels может обнаруживать небезопасные изображения для ваших примеров использования, если его обучить делать это. Также, чтобы распознавать небезопасные изображения, обратитесь к документации по API модерации.

Вопрос. Какое количество изображений необходимо, чтобы обучить собственную модель?

Количество изображений, необходимое для обучения собственной модели, зависит от изменчивости пользовательских меток, которые должна прогнозировать модель, и от качества обучающих данных. Например, для обнаружения отдельного логотипа, наложенного на изображение, может потребоваться 1–2 обучающих изображения, а для более неприметного логотипа, который необходимо обнаруживать в разных условиях (при изменении масштаба, точки зрения, наличия деформаций), может потребоваться порядка десятков или сотен обучающих примеров с высококачественными комментариями. Если у вас уже есть большое количество изображений с метками, мы рекомендуем обучать модель с использованием всех доступных изображений. Сведения об ограничениях на максимальный размер обучающего набора данных см. в документации.

Для обучения собственной модели с высокой точностью могут потребоваться сотни изображений, но несмотря на это с помощью сервиса Custom Labels вы можете сначала обучить модель, используя десятки изображений на одну метку, проверить результаты тестов, чтобы понять, работает модель или нет, и, соответственно, добавить новые обучающие изображения и повторить сеанс обучения. Такой подход позволяет итеративно улучшать вашу модель.

Вопрос. Какое количество вычислительных ресурсов для получения выводов следует выделить для собственной модели?

Количество необходимых параллельных вычислительных ресурсов для получения выводов зависит от того, сколько изображений необходимо обрабатывать в определенный момент времени. Пропускная способность одного ресурса будет зависеть от ряда факторов, например от размера изображений и их сложности (от того, какое количество обнаруживаемых объектов видно), а также от сложности вашей модели. Мы рекомендуем отслеживать периодичность, с которой вам необходимо подготавливать настраиваемую модель, и количество изображений, которые необходимо обрабатывать одновременно, чтобы максимально эффективно спланировать подготовку вашей модели.
Если вы предполагаете, что придется обрабатывать изображения регулярно (например, раз в день, раз в неделю, в запланированные временные промежутки в течение дня), следует включить пользовательскую модель в запланированное время, обработать все необходимые изображения, а затем выключить ее. Если вы не выключите модель, с вас будет взиматься плата, даже если изображения не обрабатываются.

Вопрос. Не удалось обучить модель. Будет ли с меня списана плата?

Нет. Если обучить модель не удалось, с вас не будет списана плата за вычислительные ресурсы.

Модерация контента

Вопрос. Что такое модерация контента

API модерации контента Amazon Rekognition использует глубокое обучение для выявления явного или предположительного контента для взрослых, контента, демонстрирующего насилие, визуального контента, вызывающего беспокойство, контента, демонстрирующего алкоголь, табак, символы ненависти, азартные игры и грубые жесты на изображениях и видео. Помимо маркировки изображения на основе наличия неприемлемого или оскорбительного контента, Amazon Rekognition также возвращает иерархический список меток с уровнями уверенности. Эти метки указывают на определенную подкатегорию типа обнаруженного контента, что предоставляет разработчикам возможности более точной фильтрации и управления большим объемом контента, создаваемым пользователями (UGC). Этот API можно использовать в рабочих процессах модерации для таких приложений, как социальные сети и сайты знакомств, платформы для обмена фотографиями, блоги и форумы, приложения для детей, сайты интернет‑коммерции, развлекательные сервисы и сервисы интернет‑рекламы.

Вопрос. Какие типы неприемлемого, оскорбительного и нежелательного контента выявляет Amazon Rekognition?

Полный список категорий контента, которые выявляет Amazon Rekognition, приведен здесь.

Amazon Rekognition возвращает иерархический список меток, а также уровни уверенности для каждой обнаруженной метки. Например, для определенного неприемлемого изображения Rekognition может вернуть тип «явная нагота» и дать оценку, соответствующую максимальному уровню уверенности. Разработчики могут использовать эти метаданные, чтобы помечать контент на высоком уровне, например когда нужно пометить все типы явного контента для взрослых. В том же ответе Rekognition возвращает и второй уровень детализации, предоставляя дополнительную характеристику, например, «графическое изображение обнаженного мужского тела», для которой также указывается уровень уверенности. Разработчики могут использовать эту информацию для создания более сложных алгоритмов фильтрации, соответствующих разным географическим и демографическим регионам.

Обратите внимание на то, что API модерации контента не является авторитетным источником и не претендует на роль исчерпывающего фильтра неприемлемого и оскорбительного контента. Кроме того, этот интерфейс API не определяет, содержит ли изображение запрещенный контент (например, детскую порнографию) или контент для взрослых с элементами извращений.

Если вам требуется выявлять другие типы неприемлемого контента на изображениях, свяжитесь с нами с помощью обратной связи, описанной далее в этом разделе.

Вопрос. Как узнать, какая версия модели используется в настоящий момент?

Amazon Rekognition вносит регулярные изменения в свои модели. Версию модели можно узнать в поле «ModerationModelVersion» в тексте отклика API.

Вопрос. Как определить точность модерации моих изображений и видео в процессе использования Amazon Rekognition?

Модели модерации контента Amazon Rekognition были тщательно настроены и протестированы, но мы рекомендуем проверить точность оценки на собственных наборах данных.

Можно использовать параметр «MinConfidence» в запросах API, чтобы найти баланс между обнаружением контента (отзывом) и правильностью обнаружения (точностью). Если уменьшить значение параметра «MinConfidence», скорее всего, будет обнаружена большая часть подозрительного контента, но в эту категорию также может быть включен контент, который на самом деле не относится к явному неприемлемому контенту. Если увеличить значение параметра «MinConfidence», скорее всего, вы будете уверены, что весь обнаруженный контент на самом деле является неприемлемым, но при этом некоторое неприемлемое содержимое может быть не помечено.

Вопрос. Как можно оставить отзыв о работе Rekognition для улучшения API модерации контента?

Отправить соответствующий запрос можно через службу поддержки клиентов AWS. Amazon Rekognition постоянно расширяет типы обнаруживаемого неприемлемого контента, используя отзывы клиентов. Обратите внимание на то, что запрещенный контент (например, детская порнография) не будет принят в рамках этой процедуры.

Анализ лиц

Вопрос. Что такое анализ лиц?

Анализ лиц – это процесс определения лиц на изображениях и сбора характерных атрибутов этих лиц. Amazon Rekognition Image добавляет рамку для каждого лица, обнаруженного на изображении, присваивая ему такие атрибуты, как пол, наличие солнцезащитных очков и пометки элементов лица. Rekognition Video присваивает лицам, обнаруженным в видеозаписях, временные метки, а также добавляет данные о расположении, рамку и помечает элементы лица.

Вопрос. Какие характеристики лиц возвращает Amazon Rekognition?

Amazon Rekognition возвращает следующие характеристики для обнаруженных лиц (с рамками и уровнем уверенности для каждого атрибута):

пол,
улыбка,
эмоции,
очки,
солнцезащитные очки,
открытые глаза,
открытый рот,
усы,
борода,
положение,
качество,
элементы лица.

Вопрос. Что такое положение лица?

Положение лица обозначает угол наклона обнаруженного лица по трем осям. Каждый параметр принимает значение от -180 до +180 градусов. При помощи положения лица можно определить ориентацию полигона лица (а не просто прямоугольной рамки), замерить деформацию, корректно отслеживать лица и т. д.

Вопрос. Что такое качество лица?

Качество лица обозначает качество обнаруженного изображения лица по двум параметрам: четкость и яркость. Оба параметра представляют собой значения в промежутке от 0 до 1. Установив пороговое значение для этих параметров, можно отфильтровывать только хорошо освещенные и четкие лица. Это может быть полезно в приложениях, для которых важно качество изображений лиц, например в решениях для сравнения и распознавания лиц.

Вопрос. Что такое элементы лица?

Элементы лица – это набор выступающих точек, обычно включающий в себя уголки, края или центры ключевых частей лица, таких как глаза, нос и рот. API DetectFaces сервиса Amazon Rekognition возвращает наборы элементов лиц, по которым можно обрезать лица, сливать их друг с другом, накладывать пользовательские маски, создавать фильтры и т. д.

Вопрос. Сколько лиц может быть обнаружено на изображении?

Сервис Amazon Rekognition может обнаружить на одном изображении до 100 лиц.

Вопрос. Чем анализ лица отличается от анализа видео?

Rekognition Video позволяет находить в видеозаписях лица и анализировать их характеристики (например, улыбается ли человек на изображении, открыты ли у него глаза, какие эмоции проявляются). Rekognition Video снабжает все обнаруженные лица временными метками, а также добавляет данные о расположении, рамку и помечает элементы лица (левый глаз, правый глаз, нос, левый угол рта, правый угол рта). Данные о расположении и времени можно использовать, чтобы отслеживать, как меняются эмоции на лице со временем, а также для использования дополнительных функциональных возможностей (автоматическое добавление рамки для лица, выделение или обрезка). Поиск пользователей не поддерживается для анализа видео.

Вопрос. Какие факторы, помимо разрешения видео, могут повлиять на качество работы API Rekognition Video?

Помимо разрешения видео, на работу API также существенно влияет качество лиц и их типичность (в рамках коллекций лиц, используемых для поиска). Если для распознавания лица используются различные ракурсы и вариации, например борода, очки, различные позы (в профиль и анфас), это позволит значительно повысить производительность. Как правило, если человек на записи движется слишком быстро, его лицо будет трудно распознать. Кроме того, качество результатов также снижается, если видео недостаточно четкое.

Сравнение лиц

Вопрос. Что такое сравнение лиц?

Сравнение лиц – это процедура сравнения конкретного лица с одним или несколькими другими и измерение значения сходства. С помощью API CompareFaces сервиса Amazon Rekognition Image можно измерить вероятность того, что два лица на разных изображениях принадлежат одному и тому же человеку. API сравнивает лица, обнаруженные на исходном и целевом изображениях, и возвращает значение сходства для каждой пары. Сервис также возвращает рамку и уровень уверенности для каждого обнаруженного лица. Сравнение лиц можно использовать для идентификации пользователей по сохраненным ранее фотографиям практически в режиме реального времени.

Вопрос. Можно ли использовать исходное изображение, на котором больше одного лица?

Да. Если на исходном изображении больше одного лица, CompareFaces выберет самое большое лицо и сравнит его с каждым лицом на целевом изображении.

Вопрос. Со сколькими лицами можно сравнить одно лицо?

Одно лицо с исходного изображения можно сравнить не более чем с 15 лицами, обнаруженными на целевом изображении.

Поиск лиц

Вопрос. Что такое поиск лиц?

Поиск лиц – это процесс использования исходного лица для поиска похожих совпадений в коллекции сохраненных лиц. С помощью поиска лиц можно разработать процедуры для многофакторной аутентификации платежей, автоматического пропуска сотрудников в здание и другие решения.

Вопрос. Что такое коллекция лиц и как ее создать?

Коллекция лиц – это доступный для поиска индекс векторов лиц, то есть математических представлений лиц. Rekognition не хранит изображения лиц в вашей коллекции. API CreateCollection позволяет создать коллекцию лиц в поддерживаемом регионе AWS и получить соответствующее название ресурса Amazon (ARN). Каждой коллекции присваивается уникальный идентификационный номер CollectionId.

Вопрос. Как добавить лица в коллекцию для поиска?

Для добавления лица в существующую коллекцию используется API IndexFaces. Данный API принимает изображение в виде объекта S3 или массива байтов и добавляет векторные представления обнаруженных лиц в коллекцию лиц. IndexFaces также возвращает уникальный идентификационный номер FaceId и рамку лица для каждого добавленного вектора лица.

Несколько векторов лиц одного и того же человека можно объединить, чтобы создать и сохранить вектор пользователя, с помощью API CreateUser и AssociateFaces. Векторы пользователей – более надежные представления, чем векторы одного лица, поскольку они содержат несколько векторов лиц с разной степенью освещения, резкости, различиями в позах и внешнем виде и т. д. Поиск лиц с помощью векторов пользователей может значительно повысить точность по сравнению с поиском лиц с использованием векторов одного лица. Векторы пользователей хранятся в той же коллекции, что и связанные векторы лиц.

Вопрос. Как удалить лица из коллекции?

Для удаления лица из существующей коллекции используется DeleteFaces API. Данный API открывает существующую коллекцию лиц (на основании параметра CollectionId) и удаляет указанные лица в соответствии с параметрами FaceId. Если FaceID связан с вектором пользователя, сначала необходимо удалить его из этого вектора с помощью вызова DisassoicateFaces API. Кроме того, вы можете удалить пользовательский вектор из коллекции с помощью DeleteUser API.

Подробнее о добавлении и удалении лиц см. в примере «Управление коллекциями».

Вопрос. Как выполнить поиск пользователя в коллекции?

После создания пользователей и связанных с ними FaceID можно выполнять поиск, используя изображение (SearchUsersByImage), идентификатор пользователя (SearchUsers) или FaceID (SearchUsers). Данные API принимают исходное лицо и возвращают набор похожих пользователей в порядке убывания значения сходства. Подробнее см. в примере «Поиск пользователей».

Вопрос. Как выполнить поиск лица в коллекции?

В индексированной коллекции лиц можно выполнять поиск по изображению (SearchFaceByImage) и по FaceId (SearchFaces). Данные API принимают на вход лицо и возвращают набор похожих лиц в порядке убывания значения сходства. Подробнее см. в примере Поиск лиц.

Вопрос. Чем поиск лиц отличается от анализа видео?

Rekognition Video позволяет в режиме реального времени выполнять поиск лиц в коллекциях, которые содержат несколько десятков миллионов лиц. Сначала необходимо создать коллекцию лиц, в которой будут храниться векторные представления особенностей лиц. После этого сервис Rekognition выполнит поиск в коллекции лиц, чтобы найти лица, которые имеют визуальное сходство с лицами людей на видеозаписи. Для каждого совпадения Rekognition отображает уровень уверенности, что позволяет указывать в приложении наиболее вероятные варианты. Поиск пользователей не поддерживается для анализа видео.

Вопрос. Какие факторы, помимо разрешения видео, могут повлиять на качество работы API Video?

Распознавание знаменитостей

Вопрос. Что такое распознавание знаменитостей?

Распознавание знаменитостей в Amazon Rekognition выполняется с помощью простого в использовании интерфейса API на базе глубокого обучения. Данный API предназначен для обнаружения и распознавания знаменитых, примечательных или выдающихся в своей области людей. API RecognizeCelebrities был создан для работы в любом масштабе и предназначен для распознавания знаменитостей в нескольких категориях, таких как политика, спорт, бизнес, развлечения и средства массовой информации. Функция распознавания знаменитостей идеально подходит для клиентов, которым нужно индексировать библиотеки цифровых изображений и искать в них знаменитостей, исходя из конкретных интересов.

Вопрос. Кого можно идентифицировать с помощью API распознавания знаменитостей?

Amazon Rekognition может идентифицировать только тех знаменитостей, на распознавание которых проводилась тренировка модели глубокого обучения. Обратите внимание, что API RecognizeCelebrities не претендует на представление исчерпывающего списка знаменитостей. Эта возможность была разработана с целью охватить как можно больше знаменитостей, исходя из потребностей и отзывов наших клиентов. Мы постоянно добавляем новые имена, но тот факт, что Celebrity Recognition не распознает некоторых людей, которые могут считаться знаменитыми другими организациями или нашими клиентами, не отражает нашего мнения об их статусе как знаменитостей. Если вы хотите, чтобы функция распознавания знаменитостей распознавала и других известных людей, присылайте свои предложения.

Вопрос. Может ли знаменитость, идентифицируемая через запрос API Amazon Rekognition, потребовать удаления из списка знаменитостей, с которым работает эта функция?

Да. Если знаменитость хочет быть удаленной из списка знаменитостей, с которым работает эта функция, он или она может отправить сообщение электронной почты в службу поддержки AWS, и мы выполним удаление.

Вопрос. Из каких источников предоставляется дополнительная информация о знаменитости?

Для предоставления дополнительной информации о знаменитости в рамках ответа API использует дополнительный список источников. В настоящее время мы предоставляем URL-адрес IMDB, когда таковой доступен. Мы можем добавить другие источники в будущем.

Вопрос. Чем распознавание знаменитостей отличается от анализа видеозаписей?

Сервис Rekognition Video позволяет обнаруживать и распознавать все появления известных людей на видеозаписях. Результат с временным кодом предоставляет имя и уникальный ID знаменитости, рамку лица, уровень уверенности и URL-адреса, указывающие на связанный контент для знаменитости, например ссылку на рейтинг IMDB. Распознавание знаменитостей также возможно даже в том случае, если лицо в видеозаписи скрыто. Эта функция позволяет индексировать библиотеки цифровых видеозаписей и выполнять в них поиск примеров использования, соответствующих конкретным целям рекламной или маркетинговой кампании.

Вопрос. Какие факторы, помимо разрешения видео, могут повлиять на качество работы API Rekognition Video?

Если знаменитость на видеозаписи движется слишком быстро или видео имеет недостаточную четкость, это может отрицательно сказаться на качестве работы API Rekognition Video. Кроме того, яркий макияж и одежда, которые часто используют актеры и актрисы, также может повлиять на качество.

Обнаружение текста

Вопрос. Что представляет собой функция обнаружения текста?

Обнаружение текста – это функциональная возможность Amazon Rekognition, которая позволяет обнаруживать и распознавать текст на изображениях или в видео, например названия улиц, надписи, названия продуктов, наложенная графика, субтитры к видео и номерные знаки автомобилей. Функция обнаружения текста создана именно для работы с изображениями и видеозаписями физических объектов, а не документов. API DetectText сервиса Amazon Rekognition обрабатывает изображение и возвращает текстовую метку и рамку, а также уровень уверенности для каждой обнаруженной строки символов. Таким образом, в приложениях для обмена фотографиями и приложениях социальных сетей можно, к примеру, обеспечить возможность визуального поиска на основе индекса изображений, содержащих одни и те же текстовые метки. В приложениях для обеспечения безопасности можно идентифицировать транспортные средства, распознавая номерные знаки на изображениях, получаемых с дорожных камер. Подобным образом, используя API StartTextDetection и GetTextDetection, можно обнаруживать текст в видео и получать уровни уверенности и временные метки для каждого обнаруженного текста. В мультимедийных и развлекательных приложениях можно создать текстовые метаданные, чтобы обеспечить поиск релевантного контента, например новостей, результатов спортивных соревнований, рекламных роликов и титров. Также можно проверить обнаруженный текст на нарушение политики или несоответствие требованиям, например наложенный спамерами адрес электронной почты или телефонный номер.

Вопрос. Текст какого типа поддерживается функцией обнаружения текста сервиса Amazon Rekognition?

Функция обнаружения текста создана именно для работы с изображениями и видеозаписями физических объектов, а не документов. Она обеспечивает распознавание цифр и текста на основе латиницы с поддержкой разнообразного оформления, шрифтов и стилей, а также вариантов расположения текста на объектах различной ориентации, включая вывески и плакаты. Функция обнаружения текста распознает до 50 цепочек символов в одном изображении или кадре видео и перечисляет их как слова и строки. Функция обнаружения текста поддерживает вращение текста в пределах от –90 до +90 градусов по горизонтали.

Вопрос. Можно ли ограничить обнаружение текста отдельными областями изображения или кадра видео?

Да, с помощью параметров фильтрации обнаружения текста можно задать до 10 интересующих областей (ROI) в запросе API. Amazon Rekognition возвратит только текст, который попадает в эти регионы.

Вопрос. Можно ли фильтровать обнаруженный текст по уровню уверенности в слове или по размеру рамки?

Да, в запросе API можно воспользоваться параметрами фильтрации обнаружения текста, чтобы указать пороговые значения минимальных уровней уверенности или минимальных размеров рамки.

Вопрос. Как можно оставить отзыв о работе Rekognition для улучшения распознавания текста?

Отправить соответствующий запрос можно через службу поддержки клиентов AWS. Amazon Rekognition постоянно добавляет новые типы распознаваемого текстового контента, используя отзывы клиентов.

Обнаружение средств индивидуальной защиты

Вопрос. Какие средства индивидуальной защиты может обнаруживать Amazon Rekognition?

API DetectProtectiveEquipment сервиса Amazon Rekognition может обнаруживать распространенные средства защиты лица, рук и головы. Подробнее см. в документации по возможностям. Вы также можете использовать Amazon Rekognition Custom Labels для обнаружения таких средств индивидуальной защиты, как светоотражающие жилеты, защитные очки и другие средства, уникальные для вашей деятельности. Сведения о том, как можно использовать Amazon Rekognition Custom Labels для обнаружения специальных средств индивидуальной защиты, представлены в этом репозитории github.

Вопрос. Может ли Amazon Rekognition определять местоположение средств защиты и возвращать ограничительные рамки?

Да. API DetectProtectiveEquipment в Amazon Rekognition может определять расположение средств защиты лица, рук и головы на фотографиях людей. Вы получаете координаты ограничивающего прямоугольника для каждого обнаруженного средства защиты, а также уровень достоверности. Дополнительные сведения об ответе API представлены в документации.

Вопрос. Может ли сервис определять, правильно ли надета маска?

API DetectProtectiveEquipment в Amazon Rekognition возвращает значение CoversBodyPart (true/false) и уровень достоверности логического значения для каждого обнаруженного средства защиты. Это предоставляет информацию о том, надето ли средство защиты на соответствующую часть тела человека. Прогноз о наличии средств защиты на соответствующих частях тела помогает отфильтровать те случаи, когда средство индивидуальной защиты присутствует на изображении, но не надето на человека. Однако это не означает, что человек надлежащим образом защищен и средство защиты надето правильно.

Вопрос. Может ли API обнаружения средств индивидуальной защиты в Amazon Rekognition устанавливать личность обнаруженных людей?

Нет. API обнаружения средств индивидуальной защиты в Amazon Rekognition не распознает и не сравнивает лица, поэтому не может устанавливать личность.

Вопрос. Где можно найти дополнительную информацию об ограничениях API и задержке?

Актуальные сведения об ограничениях API и задержке представлены в документации по обнаружению средств индивидуальной защиты с помощью Amazon Rekognition.

Вопрос. Как отправлять изображения с камер на месте работы в Amazon Rekognition?

Есть несколько способов захвата изображения с камер на рабочем месте. Дополнительные сведения см. в блоге, посвященном обнаружению средств индивидуальной защиты с помощью Amazon Rekognition.

Вопрос. Сколько стоит обнаружение средств индивидуальной защиты?

Обнаружение средств индивидуальной защиты с помощью Amazon Rekognition оплачивается примерно так же, как и другие API для работы с изображениями в Amazon Rekognition – по количеству изображений. Дополнительные сведения приведены на странице цен на Amazon Rekogntion.

События в потоковой передаче видео Amazon Rekognition

Вопрос. Что такое функция событий в потоковой передаче видео Amazon Rekognition?
Функция событий в потоковой передаче видео Amazon Rekognition использует машинное обучение для обнаружения объектов, снимаемых подключенной камерой, чтобы предоставлять своевременные предупреждения в реальном времени. Функция событий в потоковой передаче видео Amazon Rekognition работает с новыми и существующими потоками Kinesis Video Streams, обрабатывая потоки видео (до 120 секунд на событие движения) и уведомляя пользователя при обнаружении интересующего объекта. Эти оповещения можно использовать в следующих целях:

Интеллектуальная отправка предупреждений конечным пользователям, например, «у передней двери обнаружена посылка».
Предоставление функций автоматизации дома, например «включение света в гараже при обнаружении человека».
Интеграция с интеллектуальными помощниками, например с устройствами Echo для предоставления оповещений Alexa при обнаружении объекта.
Предоставление возможностей интеллектуального поиска, например поиска всех видеоклипов при обнаружении посылки.

Вопрос. Как работает функция событий в потоковой передаче видео Amazon Rekognition?
Приступить к работе с потоковой передачей видео событий Amazon Rekognition можно с помощью новых или уже существующих потоков Kinesis Video Streams. При настройке обработчика потоков для Amazon Rekognition можно выбрать нужные метки (человек, домашнее животное или посылка) для обнаружения, продолжительность видео (до 120 секунд на событие движение), обрабатываемого Rekognition для каждого события, и/или интересующее место на кадре, которое следует обработать посредством Rekognition. Интерфейсы API потоковой передачи видео событий Amazon Rekognition обрабатывают видео только после отправки Rekognition оповещения о необходимости начать обработку потока видео.

Если подключенная камера обнаруживает движение, Rekognition отправляется оповещение и начинается обработка потока видео. После обнаружения движения Rekognition обрабатывает соответствующий поток Kinesis Video Stream, выполняя поиск указанных нужных объектов. По обнаружении нужного объекта Amazon Rekognition отправит пользователю оповещение. В это оповещение входят обнаруженный объект, рамки, увеличенное изображение объекта и отметка времени.

Вопрос. Какие метки поддерживает функция событий в потоковой передаче видео Amazon Rekognition?
Функция событий в потоковой передаче видео Amazon Rekognition может поддерживать людей, домашних животных и посылки.

Вопрос. Какие типы домашних животных и посылок может обнаруживать функция событий в потоковой передаче видео Amazon Rekognition?
Интерфейсы API событий в потоковой передаче видео Amazon Rekognition поддерживают обнаружение собак и кошек. Интерфейсы API могут обнаруживать средние и большие картонные коробки с высокой точностью. Интерфейсы API также обнаруживают маленькие коробки, конверты с воздушно-пузырчатой плёнкой внутри и папки, но порой могут не замечать подобные объекты.

Вопрос. Нужно ли мне будет платить отдельно за каждую из меток для обнаружения? Могу ли я выбрать, какие метки мне нужны?
Нет, платить отдельно за каждую из меток для обнаружения не надо. Плата зависит от продолжительности потокового видео, обработанного Rekognition. Вы можете выбрать определенные метки (домашнее животное, посылка) или все три метки (человек, домашнее животное, посылка) при настройке параметров обработки потока.

Вопрос. Нужно ли выполнять постоянную потоковую передачу видео Amazon Rekognition?
Нет, постоянной потоковой передачи видео Amazon Rekognition не требуется.

Вопрос. Нужно ли мне создавать новые потоки Kinesis Video Streams (KVS) для использования функции событий в потоковой передаче видео?
Функция событий в потоковой передаче видео Amazon Rekognition работает и с новыми и с уже существующими потоками Kinesis Video Streams. Просто интегрируйте соответствующие потоки KVS с интерфейсом API событий в потоковой передаче видео Amazon Rekognition, чтобы приступить к анализу видео в потоках KVS.

Видео. Когда Amazon Rekognition будет отправлять мне оповещение?
Amazon Rekognition начинает обработку потока видео после обнаружения движения. Продолжительность этой обработки можно настроить (до 120 секунд на событие). Как только Amazon Rekognition обнаружит нужный объект в потоке видео, Rekognition отправит оповещение. В это оповещение входят тип обнаруженного объекта, рамки, увеличенное изображение обнаруженного объекта и отметка времени.

Вопрос. Какое разрешение и число кадров в секунду поддерживаются для обнаружения меток?
Для сокращения расходов и задержек функция событий в потоковой передаче видео Amazon Rekognition поддерживает потоки видео с разрешением 1080p или ниже. Rekognition обрабатывает поток видео с частотой 5 кадров в секунду.

Вопрос. Какие кодеки и форматы файлов поддерживаются для потоковой передачи видео?
Amazon Rekognition Video поддерживает файлы стандарта H.264 в форматах MPEG-4 (.mp4) или MOV.

Вопрос. Какова максимальная продолжительность обрабатываемого видео для события?
Можно обработать до 120 секунд видео на событие.

Вопрос. Могу ли я выбрать определенную область кадра для обработки в моем потоке видео?
Да, в рамках настройки StreamProcessor можно выбрать нужную область кадра, которую следует обрабатывать. Amazon Rekognition будет обрабатывать только эту конкретную область кадра.

Вопрос. Сколько параллельных потоков видео может одновременно анализировать Amazon Rekognition?
Функция событий в потоковой передаче видео Amazon Rekognition может поддерживать до 600 одновременных событий на клиента AWS. Обратитесь к менеджеру своей учетной записи, если необходимо увеличить это число.

Анализ архивных видеозаписей Amazon Rekognition Video

Вопрос: Какие типы объектов может обнаружить Видео Amazon Rekognition?
Видео Amazon Rekognition может обнаруживать объекты, сцены, достопримечательности, лица, знаменитостей, текст и неприемлемый контент в видео. Вы также можете искать лица, появляющиеся в видео, используя собственное хранилище или коллекцию изображений лиц.

Вопрос. Какие форматы файлов и кодеки поддерживает Amazon Rekognition Video?
Amazon Rekognition Video поддерживает файлы стандарта H.264 в форматах MPEG-4 (.mp4) или MOV. Если в ваших видеофайлах используется другой кодек, вы можете перекодировать их в формат H.264 с помощью сервиса AWS Elemental MediaConvert.

Вопрос. Как работает асинхронный API Amazon Rekognition Video?
Amazon Rekognition Video может обрабатывать видеозапись, сохраненную в корзине Amazon S3. Вы можете использовать асинхронный набор операций, вызывая для анализа видео операции обнаружения объектов и сцен с префиксом Start (например, StartLabelDetection). Статус выполнения запроса публикуется в разделе Amazon Simple Notification Service (SNS). Для получения статуса выполнения запроса в разделе Amazon SNS можно использовать очередь Amazon Simple Queue Service (SQS) или функцию AWS Lambda. После получения статуса выполнения запроса можно вызвать операцию Get (например, GetLabelDetection), чтобы просмотреть результаты обработки запроса. Список доступных интерфейсов API Amazon Rekognition Video можно найти на этой странице.

Вопрос: Как мне получить временную метку для каждого обнаружения на видео?
Видео Amazon Rekognition возвращает результаты метки по временным меткам или сегментам видео. Вы можете выбрать способ организации этих результатов с помощью входного параметра AggregateBy в API GetLabelDetection.

Если результаты поиска меток организованы по меткам времени, каждая метка будет возвращаться каждый раз, когда Видео Amazon Rekognition обнаружит эту метку на временной шкале видео. Например, если метка «Dog» обнаруживается с периодами 2000 мс и 4000 мс, Видео Amazon Rekognition вернет 2 метки для «Dog», одну с периодом 2000 мс и другую с периодом 4000 мс.
Если результаты поиска меток организованы по сегментам видео, Видео Amazon Rekognition возвращает сегмент видео, если метка обнаружена на нескольких последовательных кадрах. Сегмент видео определяется меткой начала, меткой конца и продолжительностью. Например, если «Dog» обнаружена в 2 последовательных кадрах с периодами 2000 мс и 4000 мс, Видео Amazon Rekognition вернет 1 метку для «Dog» с меткой начала 2000 мс, меткой конца 4000 мс и продолжительностью 2000 мс.

Чтобы узнать больше о метках времени и сегментах и посмотреть пример ответа API, посетите раздел Обнаружение меток в видео.

Вопрос: Сколько процессов анализа видео может одновременно выполнять Видео Amazon Rekognition?
Amazon Rekognition Video позволяет обрабатывать до 20 заданий одновременно. Более подробная информация содержится на странице лимитов.

Вопрос. Видео с каким разрешением мне лучше использовать?
Amazon Rekognition Video автоматически обрабатывает видео с широким набором разрешений и качества. Для получения оптимальных результатов мы рекомендуем предоставить видео с качеством от 720p (1280×720 пикселей) до 1080p (1920x1080 пикселей) или эквивалентного разрешения с другим соотношением сторон. Слишком низкое разрешение (например, QVGA или 240p) и слишком низкое качество могут негативно сказаться на качестве результатов.

Вопрос. Что делает функция перемещения человека?
Rekognition Video позволяет определить путь перемещения каждого человека по временной линии видеоролика. Rekognition Video умеет распознавать людей, даже когда камера находится в движении. Для каждого обнаруженного лица добавляется рамка, а также атрибуты лица и временные метки. В приложениях для розничной торговли этот сервис позволяет формировать анонимные аналитические данные о клиентах (например, пути перемещения клиентов по проходам в торговом центре или время ожидания в очереди на кассе).

Анализ мультимедиа с помощью Amazon Rekognition Video

Вопрос. Какие сегменты анализа мультимедиа может обнаружить Amazon Rekognition Video?

Amazon Rekognition Video может обнаружить следующие типы сегментов или сущностей для анализа мультимедиа:

Черный кадр. Видео часто содержит небольшие участки с пустыми черными кадрами без изображения и звука, которые используются как ориентиры для вставки рекламы или как метки завершения эпизода программы (например, определенной сцены или вступительных титров). С помощью Amazon Rekognition Video вы можете обнаруживать последовательности таких черных кадров для автоматизации вставки рекламы, сжатия видео по требованию и маркировки разных сегментов или сцен программы. Черные кадры со звуком (например, затемнения или закадровые комментарии) считаются контентом и не возвращаются этой функцией.
Титры. Amazon Rekognition Video помогает автоматически определять точные кадры начала титров в начале и конце фильма или телевизионного шоу. С помощью этих данных можно создавать «маркеры непрерывного просмотра» или интерактивные подсказки для зрителей, такие как «Следующий эпизод» или «Пропустить заставку» в приложениях VOD. Amazon Rekognition Video умеет работать с широким спектром стилей для открывающих и заключительных титров, от простых ползущих строк до более интересных вариантов, которые размещаются параллельно с контентом, титров в сценах или стилизованных титров в анимационном контенте.
Монтажный кадр. Монтажным кадром называется серия взаимосвязанных последовательных изображений, снятых непрерывно одной камерой и представляющих непрерывное действие во времени и пространстве. С помощью Amazon Rekognition Video вы можете определять начало, конец и продолжительность каждого монтажного кадра, а также подсчитывать их количество в определенном фрагменте контента. Метаданные монтажного кадра можно использовать для создания рекламных роликов на основе избранных кадров, для исключения переходов между монтажными кадрами из набора миниатюр для быстрой навигации, для вставки рекламы в конкретные места, где они не будут мешать зрителю, например не прерывая монтажный кадр или речь человека.
Цветные полосы. Amazon Rekognition Video позволяет обнаруживать участки видео с отображением цветных плашек SMPTE или EBU, которые размещаются в определенном порядке для правильной калибровки цвета на телемониторах, в программах и камерах. Подробную информацию о цветовых полосах SMPTE см. в разделе Цветовая полоса SMPTE. Эти метаданные полезны при подготовке контента для приложений демонстрации видео по требованию, позволяя удалять цветные полосы из контента или отслеживать на записи фрагменты с потерей сигнала, если цветные полосы отображаются в качестве сигнала по умолчанию при отсутствии контента.
Таблички. Таблички – это разделы, обычно располагающиеся в начале видео, в которых содержатся текстовые метаданные об эпизоде, студии, формате видео, аудиоканалах и многом другом. Amazon Rekognition может идентифицировать начало и конец таких табличек, что облегчает для операторов использование текстовых метаданных или простое удаление таблички при подготовке контента к зрительскому просмотру.
Логотипы студии. Логотипы студии – это последовательность с логотипами или эмблемами производственной студии, которая занимается созданием шоу. Amazon Rekognition определяет эти последовательности, позволяя операторам быстрее их просматривать и отмечать студии.
Контент. Под контентом понимается часть телешоу или фильма, в которой содержится программа или связанные с ней элементы. Черные рамки, титры, цветные полосы, таблички и логотипы студии не являются контентом. Amazon Rekognition Video позволяет определять начало и конец каждого сегмента видеоконтента и использовать это для множества разных задач. Например, вычислять время выполнения программы или находить определенные сегменты для конкретных целей. Краткое повторение предыдущего эпизода в начале видео – это тип контента. Как бонусный контент, который может появиться после окончания титров. Кроме того, в конце некоторых видео может содержаться «безтекстовый» контент, представляющий собой комплект программного содержимого с наложенным текстом и возможностью удаления этого текста при подготовке видео для показа на другом языке. Как только Amazon Rekognition Video обнаружит все сегменты контента, можно применить определенные характеристики домена, такие как «мои видео всегда начинаются с краткого повтора», для дальнейшей классификации каждого сегмента или отправки их на проверку.

Amazon Rekognition Video дает информацию о начале, конце, продолжительности и временных кодах каждой обнаруженной сущности, а также ставит временную метку (миллисекунды), код в формате SMPTE и указывает параметры номера каждого кадра.

Вопрос. Как начать анализ мультимедиа с помощью Amazon Rekognition Video?

Функции анализа мультимедиа вызываются через API обнаружения сегментов для сервиса Amazon Rekognition Video. Это асинхронный API, поддерживающий две операции: StartSegmentDetection для запуска анализа и GetSegmentDetection для получения результатов анализа. Подробнее о начале работы можно узнать в документации.

Если вы хотите визуализировать аналитику мультимедиа или применить для своего видео другие сервисы искусственного интеллекта Amazon, как например Amazon Transcribe, воспользуйтесьприложением Media Insights – бессерверной архитектурой и демонстрационным приложением для удобного создания аналитики и разработки приложений с поддержкой ресурсов видео, аудио, текста и изображений на основе сервисов AWS Machine Learning и AWS Media Services. Вы можете легко запустить собственное демонстрационное приложение с помощью прилагаемого шаблона AWS CloudFormation, чтобы опробовать свои видео и визуализировать результаты анализа.

Вопрос. Что такое точный временной код кадра?

Точный временной код указывает конкретный номер кадра, в котором начинается некоторый сегмент видео или содержится сущность. Компании, работающие с мультимедиа, традиционно работают с временными кодами в формате SMPTE (Society of Motion Picture and Television Engineers), который указывает часы, минуты, секунды и номер кадра, вот так: 00:24:53:22.

Вопрос. Соблюдается ли точность кадра для рамки обнаружения сегмента в Amazon Rekognition Video?

Да, API обнаружения сегментов в Amazon Rekognition Video предоставляет временные коды SMPTE с точностью до кадра, а также временные метки в миллисекундах для первого и последнего кадра каждого обнаружения.

Вопрос. Какие форматы частоты кадров поддерживает обнаружение сегментов в Amazon Rekognition Video?

Обнаружение фрагментов в Amazon Rekognition Video автоматически распознает стандарты частоты кадров в диапазоне от 15 до 60 кадров в секунду, выраженные целым, дробным числом или в формате с пропуском кадров. В частности, функция обнаружения сегментов распознает такие типичные значения частоты кадров: 23,976; 25; 29,97 и 30 кадров в секунду. В каждом из этих случаев сведения о частоте кадров применяются для предоставления временных кодов с точностью до кадра.

Вопрос. Какие параметры фильтрации можно применить?

При выполнении запроса API можно указать минимальную достоверность для каждого типа сегмента. Например, отфильтровать сегменты с уровнем достоверности ниже 70 %. Чтобы обнаружить черный кадр, можно менять максимальную яркость пикселя, принимаемого за черный. Например, выставить значение 40 для цветового диапазона от 0 до 255. Кроме того, можно контролировать, какой процент пикселей должен соответствовать этому критерию яркости для классификации черного кадр. Например, 99 %. Эти фильтры позволяют подстраиваться под разное качество и форматы. Видео, восстановленное из ленточных архивов, может содержать шумы и иметь другой уровень черного по сравнению с современным цифровым видео. Дополнительную информацию см. на этой странице.

Оплата

Вопрос. Как Amazon Rekognition учитывает количество обработанных изображений?

Для всех API, получающих на входе изображения, количеством обработанных изображений в Amazon Rekognition считается фактическое количество проанализированных изображений. К этой категории относятся API DetectLabels, DetectModerationLabels, DetectFaces, IndexFaces, RecognizeCelebrities, SearchFaceByImage и свойства изображений. Для API CompareFaces, которому на вход подаются два изображения, учитывается только обработка исходного изображения.

Для API, которые не получают на входе изображения, количеством обработанных изображений в Amazon Rekognition считается количество вызовов API. SearchFaces относится к этой категории.

Вызовы остальных API Amazon Rekognition (ListFaces, DeleteFaces, CreateCollection, DeleteCollection и ListCollections) не учитываются при подсчете обработанных изображений.

Вопрос. Как Amazon Rekognition учитывает продолжительность обработанных видеозаписей в минутах?

Архивные видеозаписи: сервис Amazon Rekognition подсчитывает продолжительность видеозаписи (в минутах), обработанных API, и суммирует полученные значения для выставления счетов. Потоки видеоданных в реальном времени оплачиваются из расчета количества обработанных пакетов по пять секунд.

Вопрос. За использование каких API Amazon Rekognition взимается плата?

Оплачиваются следующие API Amazon Rekognition Image: DetectLabels, DetectModerationLabels, DetectText, DetectFaces, IndexFaces, RecognizeCelebrities, SearchFaceByImage, CompareFaces, SearchFaces и свойства изображений. Плата за использование сервиса Amazon Rekognition Video формируется, исходя из продолжительности видеозаписи (в минутах). Считаются минуты, успешно обработанные API StartLabelDetection, StartFaceDetection, StartTextDetection, StartContentModeration, StartPersonTracking, StartCelebrityRecognition, StartFaceSearch и StartStreamProcessor.

Вопрос. Сколько стоит использование сервиса Amazon Rekognition?

Актуальную информацию о ценах см. на странице цен на Amazon Rekognition.

Вопрос. Взимается ли плата за хранение векторных отображений лиц в коллекциях?

Да. За хранение векторных отображений лиц Amazon Rekognition взимается плата в размере 0,01 USD за 1000 лиц в месяц. Подробнее см. на странице цен.

Вопрос. Распространяется ли уровень бесплатного пользования AWS на Amazon Rekognition?

Да. В рамках уровня бесплатного пользования AWS можно начать работу с Amazon Rekognition бесплатно. После регистрации новым пользователям Amazon Rekognition доступен анализ до 5000 изображений в месяц в течение первых 12 месяцев. В рамках уровня бесплатного пользования также можно бесплатно использовать API Amazon Rekognition, но не свойства изображений, и хранить до 1000 лиц. Для клиентов Amazon Rekognition Video также доступен бесплатный анализ 1000 минут видеозаписей в месяц в течение первого года использования.

Вопрос. Указанные цены включают налоги?

Подробнее о налогах см. на странице справки по налогам при работе с Amazon Web Services.

Интеграция с сервисами AWS

Вопрос. Поддерживает ли Amazon Rekognition Video работу с изображениями, хранящимися в Amazon S3?

Да. Чтобы начать анализировать изображения на Amazon S3, достаточно указать API Amazon Rekognition на корзину S3. Данные никуда перемещать не нужно. Подробнее о работе с объектами S3 и API Amazon Rekognition см. в упражнении по определению меток.

Вопрос. Можно ли использовать Amazon Rekognition для анализа изображений, которые хранятся в корзине Amazon S3 в другом регионе?

Нет. Убедитесь, что корзина Amazon S3, которую вы хотите использовать, находится в том же регионе, что и ваш адрес API Amazon Rekognition.

Вопрос. Как можно пакетно обрабатывать множество изображений в Amazon Rekognition?

Для пакетной обработки изображений из Amazon S3 следуйте шагам, описанным в примере пакетной обработки изображений Amazon Rekognition на GitHub.

Вопрос. Как использовать AWS Lambda с Amazon Rekognition?

Amazon Rekognition поддерживает эффективное взаимодействие с AWS Lambda и позволяет реализовать в хранилищах данных AWS, таких как Amazon S3 и Amazon DynamoDB, анализ изображений в ответ на события. Чтобы начать использовать Amazon Rekognition вместе с AWS Lambda, выполните шаги, описанные здесь, и выберите схему, предложенную сервисом Amazon Rekognition.

Вопрос. Работает ли Amazon Rekognition с AWS CloudTrail?

Да. Amazon Rekognition поддерживает запись в файлы журнала CloudTrail в качестве событий для следующих действий: CreateCollection, DeleteCollection, CreateStreamProcessor, DeleteStreamProcessor, DescribeStreamProcessor, ListStreamProcessors и ListCollections. Подробнее о вызовах API Amazon Rekognition, интегрированных с AWS CloudTrail, см. в разделе «Logging Amazon Rekognition API Calls with AWS CloudTrail».

Конфиденциальность данных

Вопрос. Сохраняются ли данные изображений и видеозаписей, обработанных Amazon Rekognition, и как они используются в AWS?

Сервис Amazon Rekognition может хранить и использовать обрабатываемые изображения и видеозаписи исключительно в целях предоставления и поддержки сервиса, а также развития и улучшения качества Amazon Rekognition и других технологий машинного обучения и искусственного интеллекта Amazon, если вы не отключите эту функцию ниже. Использование контента необходимо для постоянного совершенствования интерфейса Amazon Rekognition, включая разработку, настройку и обучение соответствующих технологий. Мы не используем какие-либо данные, идентифицирующие личность, которые могут содержаться в контенте, в целях продвижения продуктов, услуг или рекламы в адрес клиента или конечных пользователей. Доверие клиентов, конфиденциальность и безопасность их контента являются главными приоритетами компании. Мы применяем соответствующие комплексные технические и физические средства контроля, включая шифрование хранимых и передаваемых данных, для предотвращения неавторизованного доступа к данным и контенту клиентов или их раскрытия и гарантируем, что использование этих данных соответствует нашим обязательствам перед клиентами. Подробнее см. на странице https://aws.amazon.com/compliance/data-privacy-faq/. Вы можете отказаться от использования ваших изображений и видеозаписей в целях развития и повышения качества Amazon Rekognition и других технологий Amazon на основе машинного обучения и искусственного интеллекта, воспользовавшись политикой отказа в AWS Organizations. Подробнее о том, как оформить отказ, см. на странице политики по использованию сервисов с элементами искусственного интеллекта.

Вопрос. Можно ли удалять данные изображений и видеозаписей, сохраненные Amazon Rekognition?

Да. Удаление изображений и видеозаписей, связанных с аккаунтом клиента, можно запросить, связавшись со службой поддержки AWS Support. Удаление изображений и видеозаписей может отрицательно сказываться на работе Amazon Rekognition.

Вопрос. У кого есть доступ к моему контенту, который обрабатывается и хранится Amazon Rekognition?

Доступ к контенту клиентов, который обрабатывается и хранится сервисом Amazon Rekognition, имеют исключительно авторизованные сотрудники. Доверие клиентов, конфиденциальность и безопасность их контента являются главными приоритетами компании. Мы применяем соответствующие комплексные технические и физические средства контроля, включая шифрование хранимых и передаваемых данных, для предотвращения неавторизованного доступа к данным и контенту клиентов или их раскрытия и гарантируем, что использование этих данных соответствует нашим обязательствам перед клиентами. Подробнее см. на странице https://aws.amazon.com/compliance/data-privacy-faq/.

Вопрос. Буду ли я по-прежнему владельцем контента, который обрабатывается и хранится сервисом Amazon Rekognition?

Вы являетесь полноправным владельцем своего контента. Мы будем использовать его только с вашего разрешения.

Вопрос. Выходит ли контент, обрабатываемый сервисом Amazon Rekognition, за границу той области AWS, в которой пользователь использует Amazon Rekognition?

Весь контент, который обрабатывается сервисом Amazon Rekognition, шифруется и сохраняется в той области AWS, в которой вы используете Amazon Rekognition. Если вы не отключите эту функцию, как указано ниже, определенная часть контента, обрабатываемая Amazon Rekognition, может храниться в другой области AWS, однако это служит исключительно целям постоянного развития и совершенствования интерфейса Amazon Rekognition и других технологий машинного обучения и искусственного интеллекта Amazon. Удаление изображений и видеозаписей, связанных с аккаунтом клиента, можно запросить, связавшись со службой поддержки AWS Support. Доверие клиентов, конфиденциальность и безопасность их контента являются главными приоритетами компании. Мы применяем соответствующие комплексные технические и физические средства контроля, включая шифрование хранимых и передаваемых данных, для предотвращения неавторизованного доступа к данным и контенту клиентов или их раскрытия и гарантируем, что использование этих данных соответствует нашим обязательствам перед клиентами. Подробнее см. на странице https://aws.amazon.com/compliance/data-privacy-faq/. Ваш контент не будет храниться в другом регионе AWS, если вы откажетесь от использования своего контента для развития и улучшения качества Amazon Rekognition и других технологий машинного обучения и искусственного интеллекта Amazon. Подробнее о том, как оформить отказ, см. на странице политики по использованию сервисов с элементами искусственного интеллекта.

Вопрос. Можно ли использовать Amazon Rekognition вместе с веб-сайтами, программами или другими приложениями, которые ориентированы на детей в возрасте до 13 лет и подпадают под действие Закона о защите конфиденциальности детей в Интернете (COPPA)?

Да. При условии соблюдения условий использования Amazon Rekognition, согласившись с которыми, вы обязались предоставлять любые необходимые предупреждения и получать любое требуемое согласие родителей, поддающееся проверке, в рамках COPPA, вы можете использовать Amazon Rekognition вместе с веб-сайтами, программами или другими приложениями, которые целиком или частично ориентированы на детей в возрасте до 13 лет.

Вопрос. Как определить, распространяется ли действие COPPA на мой веб-сайт, программу или приложение?

Для получения информации о требованиях COPPA и инструкций по определению того, распространяются ли требования COPPA на конкретный веб-сайт, программу или другое приложение, обратитесь непосредственно к ресурсам, предоставляемым и поддерживаемым Федеральной торговой комиссией США. На указанном сайте также содержится информация о том, как определить, ориентирован ли сервис полностью или частично на детей в возрасте до 13 лет.

Вопрос. Соответствует ли сервис Amazon Rekognition требованиям HIPAA?

Сервис Amazon Rekognition соответствует требованиям HIPAA и подпадает под действие договора делового партнерства AWS (AWS BAA). Если организация заключила с AWS договор BAA, сервис Amazon Rekognition будет использовать, раскрывать и хранить закрытую медицинскую информацию организации (PHI) только в соответствии с условиями договора AWS BAA.

Контроль доступа

Вопрос. Как управлять доступом к Amazon Rekognition?

Сервис Amazon Rekognition интегрирован с AWS Identity and Access Management (IAM). Политики AWS IAM позволяют предоставить доступ к API Amazon Rekognition только определенному кругу авторизованных пользователей. Подробнее см. на странице аутентификации и контроля доступа к Amazon Rekognition.

Сообщить о нарушении

Вопрос. Как сообщить о возможном нарушении Amazon Rekognition?

Если вы подозреваете, что Amazon Rekognition используется незаконно или с нарушениями, посягает на ваши права или права других людей, сообщите об этом, и AWS изучит эту проблему.

Подробнее о ценах на Amazon Rekognition

Перейти на страницу цен

Готовы приступить к разработке?

Начать работу с AWS Rekognition

Есть вопросы?

Связаться с нами

Вопросы и ответы по Amazon Rekognition