Amazon Transcribe

Автоматическое распознавание речи

Amazon Transcribe – это сервис автоматического распознавания речи (ASR), позволяющий разработчикам без труда добавлять в свои приложения возможности преобразования речи в текст С помощью API сервиса Amazon Transcribe можно анализировать аудиофайлы, хранящиеся в Amazon S3, и получать текстовые файлы с расшифровкой речи. Также можно транслировать аудио в Amazon Transcribe и получать расшифровку речи в реальном времени.

Amazon Transcribe можно применять для решения широкого круга стандартных задач, включая расшифровку телефонных обращений в службу поддержки и создание субтитров для аудио‑ и видеоконтента. Сервис распознает файлы в стандартных аудиоформатах (например, WAV и MP3) и указывает в тексте временную метку для каждого слова, что позволяет без труда найти нужный фрагмент в исходной аудиозаписи. При этом Amazon Transcribe постоянно обучается и развивается вместе с языком.

AWS San Francisco Summit 2018 – Amazon Transcribe is Now Generally Available

Основные возможности

Удобочитаемые расшифровки

Большинство систем распознавания речи выдает текст одной строкой без знаков препинания. Amazon Transcribe применяет технологии глубокого обучения для автоматического форматирования и расстановки знаков препинания. Итоговый текст гораздо проще читается и готов к использованию без редактирования.

Временные метки

Amazon Transcribe указывает в тексте временную метку для каждого слова, что позволяет без труда найти нужный фрагмент в исходной аудиозаписи.

Поддержка разнообразных примеров использования

Сервис Amazon Transcribe автоматически формирует точные расшифровки аудиозаписей различного качества. Он позволяет создавать субтитры для любых видео‑ или аудиофайлов и даже расшифровывать записи телефонных разговоров низкого качества, например телефонные обращения в службу поддержки.

Настраиваемый словарь

Amazon Transcribe позволяет дополнять и редактировать словарь для распознавания речи. В базовый словарь можно добавлять новые слова для получения максимально точных расшифровок в любых примерах использования сервиса, например названия продуктов, специальную терминологию или имена отдельных лиц.

Распознавание говорящих

Amazon Transcribe может распознавать смену говорящего и вносить в текст соответствующие метки. Это существенно облегчает работу по расшифровке телефонных разговоров, совещаний, телепередач и других аудиозаписей с несколькими участниками.

Определение каналов

Amazon Transcribe может обрабатывать аудио и видео, где речь каждого говорящего записана в отдельный канал. Это предоставляет значительные преимущества контактным центрам: они могут отправлять в Amazon Transcribe общие аудиофайлы, а сервис будет распознавать каналы и создавать единую расшифровку с метками, аннотирующими реплики из разных каналов.

Потоковая расшифровка речи

С помощью Amazon Transcribe можно превращать аудио в текст в реальном времени. Используя защищенное соединение по протоколу HTTP 2, можно отправлять в сервис аудиопоток прямой трансляции и получать на выходе текстовый поток в режиме реального времени.

Подробнее >>

Примеры использования

Amazon Transcribe можно использовать для решения широкого круга задач по распознаванию речи в различных областях, включая деятельность служб поддержки клиентов, подготовку субтитров, поиск информации и обеспечение соответствия требованиям.

Повышение качества обслуживания клиентов

Возможность преобразования речи в текст позволяет создавать на основе Amazon Transcribe приложения для анализа текста с функцией поиска и анализа голосовой информации. В контактных центрах сервис Amazon Transcribe может применяться для расшифровки телефонных разговоров с клиентами и последующего анализа этих данных с помощью других сервисов AWS, например Amazon Comprehend для понимания смысла и цели разговора.

Рабочие процессы подготовки субтитров

Создатели и распространители мультимедийного контента могут использовать Amazon Transcribe для автоматического создания субтитров с временными метками. Показ видео с субтитрами делает материал доступнее и расширяет охват аудитории.

Каталогизация архивных аудиозаписей

Сервис позволяет создавать на основе аудио и видеозаписей архивы с возможностью полнотекстового поиска для управления рисками и обеспечения соответствия требованиям. Клиенты могут использовать Amazon Transcribe для преобразования речи в текст, чтобы затем с помощью сервиса Amazon Elasticsearch выполнять индексирование и текстовый поиск по всей библиотеке аудио- и (или) видеоматериалов.

Клиенты Amazon Transcribe

Подробнее о ценах на Amazon Transcribe

Перейти на страницу цен
Готовы приступить к разработке?
Есть вопросы?
Свяжитесь с нами