Amazon Lex запускает новые многоязычные модели распознавания речи

Проведено: 11 дек. 2024 г.

Мы рады анонсировать новые общедоступные модели распознавания речи из потоковых передач (ASR-2.0) с поддержкой разных языков в Amazon Lex. Эти модели увеличивают точность распознавания за счет особого группирования языков: имеется европейская модель, поддерживающая португальский, каталанский, французский, итальянский, немецкий и испанский, и модель для Азиатско-Тихоокеанского региона, поддерживающая китайский, корейский и японский языки.

Эти многоязычные модели Amazon Lex для потоковых данных используют общие языковые шаблоны для каждой группы, чтобы повысить точность расшифровки. Модели особенно хорошо распознают произношение букв и цифр, чтобы точнее понимать речь клиентов для идентификации вызывающих абонентов и автоматизации задач в приложениях интерактивного голосового меню (IVR). Например, новые модели лучше считывают номера аккаунтов, подтверждающие и серийные номера, а также коды продуктов. Эти улучшения распространяются на все региональные варианты поддерживаемых языков (например, на европейский и канадский варианты французского). Кроме того, новые модели демонстрируют более высокую точность распознавания речи лиц, не являющихся носителями языка, и различных региональных акцентов, что делает общение более инклюзивным и заслуживающим доверия. Теперь эти модели являются стандартными для поддерживаемых языков в Amazon Lex и клиентам достаточно просто рекомпилировать имеющиеся боты, чтобы воспользоваться этими улучшениями.

Новые модели ASR-2.0 сейчас доступны во всех регионах, поддерживающих Amazon Lex V2.