Функции Amazon Transcribe. Amazon Web Services (AWS)

Amazon Transcribe – это сервис автоматического распознавания речи (ASR) на основе модели Speech Foundation, поддерживающий более 100 языков. Благодаря функциям Transcribe вы можете принимать аудиоданные, создавать удобные для чтения и просмотра расшифровки, повышать точность с помощью персонализации и фильтровать контент для обеспечения конфиденциальности клиентов.

Прием звуковой информации

Transcribe разработан для обработки прямой трансляции или записи в аудио- или видеоформате с целью создать высококачественную расшифровку для удобства поиска и анализа. Мы также предлагаем отдельные API-интерфейсы, специально настроенные для распознавания звонков от клиентов (Аналитика звонков Amazon Transcribe) и медицинских разговоров (Amazon Transcribe Medical).

Потоковая и пакетная расшифровка

Вы можете обрабатывать существующие аудиозаписи или передавать потоковое аудио для расшифровки в реальном времени. Используя защищенное соединение, можно отправлять в сервис аудиопоток прямой трансляции и получать на выходе текстовый поток.

Модели для конкретных предметных областей

Выберите модель, которая настроена на расшифровку телефонных звонков или мультимедийный видеоконтент. Например, Transcribe учитывает низкое качество звука, характерное для звонков в контактные центры.

Автоматическое определение языка

В Amazon Transcribe можно автоматически определять основной язык для файла аудиозаписи при создании расшифровки. Это удобно, если у вас есть аудиотека с файлами на разных языках. Вы также можете использовать эту функцию для классификации медиаконтента и проверки правильности маркировки основного языка речи в видеофайлах и подкастах.

Легко читаемые расшифровки

Amazon Transcribe позволяет создавать точные расшифровки, которые легко читать, просматривать и интегрировать в целевые приложения. Мы стараемся, чтобы выходные данные были готовы к передаче в другие автоматизированные действия, например для анализа расшифровок телефонных разговоров, добавления субтитров или поиска по контенту.

Нормализация знаков препинания и чисел

Amazon Transcribe автоматически расставляет знаки препинания и применяет форматирование, поэтому полученный результат по качеству почти не уступает результатам ручной расшифровки, а затраты и время обработки многократно уменьшаются. Произнесенные числа записываются цифрами в «обычном виде», а не словами.

Метки времени

Amazon Transcribe предоставляет метку времени для каждого слова, что позволяет без труда найти нужное слово или фразу в исходной аудиозаписи или добавить субтитры в видео.

Распознавание говорящих

Смена говорящих автоматически распознается и выделяется в тексте. Это обеспечивает точную расшифровку в таких сценариях, как телефонные звонки, совещания и телепередачи. Подробные сведения о распознавании говорящих.

Распознавание каналов

Контактные центры могут отправить в Amazon Transcribe один аудиофайл, и сервис выдаст одну расшифровку с автоматически проставленными метками каналов.

Настройки выходных данных

Точность очень важна, и мы предлагаем вам множество возможностей настроить расшифровку с учетом бизнес-потребностей, жаргона или диалекта. Transcribe также предоставляет до 10 альтернативных расшифровок для каждого предложения, чтобы вы могли быстро выбрать наилучший вариант для вашего контента и предметной области. Это полезно для рабочих процессов создания субтитров с участием человека.

Настраиваемый словарь

С помощью настраиваемых словарей можно добавлять новые слова для получения максимально точных расшифровок слов и фраз, связанных с конкретной предметной областью, таких как названия продуктов, техническая терминология или имена людей.

Пользовательские языковые модели

При необходимости вы можете создать и обучить пользовательскую языковую модель (CLM), которая будет учитывать сценарий использования и предметную область, отправив комплект текстовых данных в Amazon Transcribe. CLM – это удобная функция для повышения точности распознавания речи путем добавления собственных данных.

Функции для обеспечения безопасности и конфиденциальности пользователей

Защита конфиденциальности и безопасности клиентов крайне важна. При необходимости Transcribe может скрывать или удалять из результатов расшифровки определенные слова, которые считаются конфиденциальными или неприемлемыми для целевой аудитории.

Фильтрация по словарю

Функция фильтрации по словарю позволяет указать список слов, которые нужно удалять из расшифровок. Например, если вы составите список ненормативной или оскорбительной лексики, Amazon Transcribe будет удалять такие слова автоматически.

Функции для обеспечения безопасности и конфиденциальности пользователей

Автоматическое редактирование контента и персональных данных

Сервис Amazon Transcribe помогает клиентам распознавать и удалять информацию, позволяющую установить личность (PII) из расшифровок на поддерживаемых языках. Это позволяет контактным центрам без опасений передавать расшифровки для анализа и совместного доступа, если это потребуется для повышения качества обслуживания клиентов и обучения персонала.

Защита данных

Защитите данные в местах хранения с помощью ключа Amazon S3 (SSE-S3) или передайте собственный ключ в Сервис управления ключами AWS (AWS KMS). Amazon Transcribe применяет криптографический протокол TLS (Transport Layer Security) версии 1.2 для аутентифицикации соединений и безопасной передачи данных через Интернет по протоколу HTTP, а также сертификаты AWS для шифрования передаваемых данных. Это относится и к потоковым расшифровкам.

Обнаружение токсичного аудиоконтента

Сервис «Обнаружение токсичности Amazon Transcribe» на основе машинного обучения следит за тем, чтобы аудиообщение было культурным и конструктивным, для создания безопасной и инклюзивной онлайн-среды. Токсичный аудиоконтент маркируется по нескольким категориям, чтобы модераторы могли легко найти его и принять соответствующие меры.

Аналитика звонков Amazon Transcribe

С помощью Аналитики звонков Amazon Transcribe можно извлекать из разговоров аналитические данные, например о настроении и громкости речи, что помогает повысить производительность сотрудников и качество обслуживания клиентов.

Повысьте производительность работы в контактных центрах с помощью сводки о звонках, сделанной с помощью генеративного искусственного интеллекта

Автоматически генерируйте сводки по звонкам, чтобы помочь агентам сосредоточиться на обеспечении отличного обслуживания клиентов и повышении производительности за счет сокращения длительности обработки данных после звонка вручную. Эта возможность позволяет обрабатывать взаимодействие с абонентом и фиксировать ключевые компоненты, такие как причина вызова, шаги, предпринятые для решения проблемы, и последующие шаги. Руководители контактного центра могут просматривать сводки о звонках, чтобы быстро понять контекст взаимодействия, не читая всю расшифровку и не изучая проблемы звонящих.

Подробная аналитика звонков и разговоров

Используя возможности машинного обучения, вы можете быстро применять функции преобразования речи в текст и обработки естественного языка для получения ценной информации о разговорах. Это позволяет выполнять в приложениях анализ входящих и исходящих звонков по таким интегрированным данным, как настроение клиентов и сотрудников, обнаруженные проблемы и дополнительные характеристики речи, как например время молчания, количество прерываний и скорость разговора. Это поможет руководителям быстрее выявлять потенциальные проблемы клиентов, возможности для обучения сотрудников и общие тенденции разговоров.

Примените автоматическую классификацию вызовов для поддержания соответствия требованиям и организации мониторинга.

Отслеживайте свои звонки в большом масштабе, чтобы проверять их на соответствие политикам компании или нормативным требованиям. Создавайте и обучайте собственные категории на основе заданных вами критериев (например, слов и фраз или характеристик разговора). Например, вы можете настроить ярлыки категорий для анализа того, какой процент звонков составляют дополнительные покупки или отказы от подписки.

Создание расшифровок звонков с расширенной информацией

Предоставьте своим сотрудникам дополнительную информацию, полученную в ходе предыдущих взаимодействий. Пошаговые расшифровки содержат полезную информацию, например о настроении клиентов, обнаруженных проблемах и прерываниях.

Защита конфиденциальных данных клиентов

Беседы часто содержат конфиденциальные данные о клиентах, такие как имена, адреса, номера кредитных карт и номера социального страхования. Аналитика звонков Amazon Transcribe помогает клиентам обнаружить такую информацию и удалить ее как из аудио, так и из текста.

Интеграции с контактными центрами

Genesys Cloud CX
Genesys Cloud CX – это облачное решение для создания контактного центра, объединяющего в себе все взаимодействие между клиентом и сотрудником по разным каналам: телефонные звонки, SMS-сообщения, чаты и так далее. Вы можете расшифровывать аудиозаписи звонков в Amazon Transcribe прямо из облачной среды Genesys, чтобы повысить производительность сотрудников и получать аналитические сведения о взаимодействиях с клиентами. Дополнительную информацию см. в разделе об интеграции с Genesys Cloud AudioHook. Кроме того, полученные через Genesys Cloud звонки можно анализировать с помощью решения «Аналитика во время звонка AWS».

SDK для Amazon Chime
SDK для Amazon Chime – это набор компонентов для связи в режиме реального времени. С его помощью разработчики могут быстро добавить в приложения для интернета, мобильных устройств и телефонии дополнительные возможности: совершать аудио- и видеовызовы или совместно использовать экран.

Транкинговый сервис Amazon Chime
Транкинговый сервис Amazon Chime позволяет легко настраивать интеграции с контактными центрами на базе SIP чтобы с помощью Amazon Transcribe в реальном времени создавать расшифровки звонков с пользовательскими атрибутами. Дополнительную информацию см. в документации по Транкинговому сервису Amazon Chime.

Amazon Transcribe Medical

Разделы медицины

Создавайте расшифровки медицинских разговоров без особого труда с помощью сервиса автоматического распознавания речи Transcribe Medical, который соответствует требованиям HIPAA.

Режим диктовки

Точно расшифровывайте звуковую дорожку с одним говорящим, которая характерна для режима медицинской диктовки. Подробнее »

Режим диалога

Точно расшифровывайте звуковую дорожку с несколькими говорящими, которыми могут быть как врачи, так и пациенты. Подробнее »

Преобразуйте речь в текст с учетом разных разделов медицины. Подробнее »

API пакетной обработки

Расшифровывайте записанные аудиофайлы с медицинским контентом в большом масштабе, используя высокую степенью параллелизма. Подробнее »

API потоковой передачи

Получайте расшифровку аудиопотоков практически в реальном времени по протоколу WebSocket Secure или HTTP/2. Подробнее »

Настраиваемый словарь

Повысьте точность расшифровки, используя собственный словарь для учета терминологии, не входящей в типичный лексикон. Подробнее »

Распознавание каналов

Параллельно обрабатывайте многоканальный звук без дополнительной оплаты. Результат будет собран в единую осмысленную расшифровку. Подробнее »

Диаризация говорящих

Разделяйте речь нескольких говорящих в любом одноканальном источнике звука. Подробнее »

Подробнее о ценах на продукт

Посетите страницу цен на Amazon Transcribe.

Подробнее

Зарегистрировать бесплатный аккаунт

Получите мгновенный доступ к уровню бесплатного пользования AWS.

Регистрация

Начать разработку в консоли

Начните разработку с помощью Amazon Transcribe в Консоли управления AWS.

Вход

Функции Amazon Transcribe

Прием звуковой информации

Потоковая и пакетная расшифровка

Модели для конкретных предметных областей

Автоматическое определение языка

Легко читаемые расшифровки

Нормализация знаков препинания и чисел

Метки времени

Распознавание говорящих

Распознавание каналов

Настройки выходных данных

Настраиваемый словарь

Пользовательские языковые модели

Функции для обеспечения безопасности и конфиденциальности пользователей

Фильтрация по словарю

Автоматическое редактирование контента и персональных данных

Защита данных

Обнаружение токсичного аудиоконтента

Аналитика звонков Amazon Transcribe

Повысьте производительность работы в контактных центрах с помощью сводки о звонках, сделанной с помощью генеративного искусственного интеллекта

Подробная аналитика звонков и разговоров

Примените автоматическую классификацию вызовов для поддержания соответствия требованиям и организации мониторинга.

Создание расшифровок звонков с расширенной информацией

Защита конфиденциальных данных клиентов

Интеграции с контактными центрами

Amazon Transcribe Medical

Разделы медицины

Режим диктовки

Режим диалога

API пакетной обработки

API потоковой передачи

Настраиваемый словарь

Распознавание каналов

Диаризация говорящих

Прекращение поддержки Internet Explorer