Amazon Transcribe – это сервис автоматического распознавания речи (ASR), позволяющий разработчикам без труда добавлять в свои приложения возможности преобразования речи в текст С помощью API сервиса Amazon Transcribe можно анализировать аудиофайлы, хранящиеся в Amazon S3, и получать текстовые файлы с расшифровкой речи. Также можно транслировать аудио в Amazon Transcribe и получать расшифровку речи в реальном времени.
Amazon Transcribe можно применять для решения широкого круга стандартных задач, включая расшифровку телефонных обращений в службу поддержки и создание субтитров для аудио‑ и видеоконтента. Сервис распознает файлы в стандартных аудиоформатах (например, WAV и MP3) и указывает в тексте временную метку для каждого слова, что позволяет без труда найти нужный фрагмент в исходной аудиозаписи. При этом Amazon Transcribe постоянно обучается и развивается вместе с языком.
Основные возможности
Удобочитаемые расшифровки
Большинство систем распознавания речи выдает текст одной строкой без знаков препинания. Amazon Transcribe применяет технологии глубокого обучения для автоматического форматирования и расстановки знаков препинания. Итоговый текст гораздо проще читается и готов к использованию без редактирования.
Временные метки
Amazon Transcribe указывает в тексте временную метку для каждого слова, что позволяет без труда найти нужный фрагмент в исходной аудиозаписи.
Поддержка разнообразных примеров использования
Сервис Amazon Transcribe автоматически формирует точные расшифровки аудиозаписей различного качества. Он позволяет создавать субтитры для любых видео‑ или аудиофайлов и даже расшифровывать записи телефонных разговоров низкого качества, например телефонные обращения в службу поддержки.
Настраиваемый словарь
Amazon Transcribe позволяет дополнять и редактировать словарь для распознавания речи. В базовый словарь можно добавлять новые слова для получения максимально точных расшифровок в любых примерах использования сервиса, например названия продуктов, специальную терминологию или имена отдельных лиц.
Распознавание говорящих
Amazon Transcribe может распознавать смену говорящего и вносить в текст соответствующие метки. Это существенно облегчает работу по расшифровке телефонных разговоров, совещаний, телепередач и других аудиозаписей с несколькими участниками.
Определение каналов
Amazon Transcribe может обрабатывать аудио и видео, где речь каждого говорящего записана в отдельный канал. Это предоставляет значительные преимущества контактным центрам: они могут отправлять в Amazon Transcribe общие аудиофайлы, а сервис будет распознавать каналы и создавать единую расшифровку с метками, аннотирующими реплики из разных каналов.
Потоковая расшифровка речи
С помощью Amazon Transcribe можно превращать аудио в текст в реальном времени. Используя защищенное соединение по протоколу HTTP 2, можно отправлять в сервис аудиопоток прямой трансляции и получать на выходе текстовый поток в режиме реального времени.
Примеры использования
Amazon Transcribe можно использовать для решения широкого круга задач по распознаванию речи в различных областях, включая деятельность служб поддержки клиентов, подготовку субтитров, поиск информации и обеспечение соответствия требованиям.
Повышение качества обслуживания клиентов
Возможность преобразования речи в текст позволяет создавать на основе Amazon Transcribe приложения для анализа текста с функцией поиска и анализа голосовой информации. В контактных центрах сервис Amazon Transcribe может применяться для расшифровки телефонных разговоров с клиентами и последующего анализа этих данных с помощью других сервисов AWS, например Amazon Comprehend для понимания смысла и цели разговора.
Рабочие процессы подготовки субтитров
Создатели и распространители мультимедийного контента могут использовать Amazon Transcribe для автоматического создания субтитров с временными метками. Показ видео с субтитрами делает материал доступнее и расширяет охват аудитории.
Каталогизация архивных аудиозаписей
Сервис позволяет создавать на основе аудио и видеозаписей архивы с возможностью полнотекстового поиска для управления рисками и обеспечения соответствия требованиям. Клиенты могут использовать Amazon Transcribe для преобразования речи в текст, чтобы затем с помощью сервиса Amazon Elasticsearch выполнять индексирование и текстовый поиск по всей библиотеке аудио- и (или) видеоматериалов.
Клиенты Amazon Transcribe
Подробнее о ценах на Amazon Transcribe