Amazon Polly

Преобразование текста в естественную речь с помощью глубокого обучения

Послушать Amazon Polly >>

Amazon Polly – это сервис, который преобразует текст в естественную речь, позволяя разрабатывать говорящие приложения и создавать совершенно новые категории продуктов с поддержкой речевых интерфейсов. Amazon Polly – это сервис преобразования текста в речь, который с помощью продвинутых технологий глубокого обучения позволяет синтезировать речь, практически не отличимую от человеческой.

Сервис включает в себя множество естественно звучащих голосов для различных языков. Клиенты могут выбирать подходящие голоса и создавать приложения с поддержкой речевых интерфейсов для различных стран.

Введение в Amazon Polly
Язык Женский голос Мужской голос Образец текста
Английский Джоанна Мэттью Hello. Do you speak a foreign language? One language is never enough.
Датский Ная Мадс Hej. Taler du et fremmed sprog? Et sprog er aldrig nok.
Португальский (Бразилия) Витория Рикарду Oi. Você fala algum idioma estrangeiro? Somente um idioma nunca é bastante.
Испанский Пенелопа Мигель Hola. ¿Hablas algún idioma extranjero? Un solo idioma no es suficiente.no
Французский Léa Мэтью Bonjour. Parlez-vous une autre langue que le français? Une langue n'est jamais assez.
Японский Мизуки
Такуми こんにちは、外国語を話せますか? 世界にはたくさんの言語があります。
Корейский Со Ён   안녕하세요? 외국어를 구사하십니까? 이 세상에는 수많은 언어들이 있답니다。
Полный список голосов и языков, поддерживаемых Amazon Polly, см. здесь.

Преимущества

Естественное звучание голоса

Amazon Polly предлагает десятки языков и широкий выбор естественно звучащих мужских и женских голосов. Естественно звучащее произношение текста сервисом Amazon Polly позволяет обеспечить высокое качество выходного речевого сигнала для глобальной аудитории.

Хранение и распространение речи

Amazon Polly допускает неограниченные повторы сгенерированной речи без дополнительной платы. Можно создавать речевые файлы в стандартных форматах, таких как MP3 и OGG, и транслировать их из облака или воспроизводить локально приложениями или устройствами для автономного воспроизведения.

Потоковая передача в режиме реального времени

Синтез естественной речи и обеспечение работы голосовых диалоговых интерфейсов требует минимального времени ответа. После того как в API Amazon Polly отправляется текст, сервис направляет обратно в приложение аудиопоток, а значит, воспроизводить голоса можно сразу. 

Настройка речевого выхода и управление им

Изменяйте голоса Amazon Polly так, как вам требуется. Amazon Polly поддерживает различные лексиконы и теги SSML, которые позволяют контролировать такие аспекты речи, как произношение, громкость, высота голоса, скорость и т. д.  

 

 

Низкая стоимость

Оплата Amazon Polly по факту использования, низкая стоимость преобразования символа и неограниченные повторы делают сервис экономичным способом озвучивания приложений.

Примеры использования

Создание контента

Звук может использоваться в качестве дополнительного средства коммуникации при письменном и/или визуальном общении. Передавая контент голосом, можно предоставить аудитории альтернативный способ потребления информации и удовлетворить потребности расширенного круга читателей. Amazon Polly может генерировать речь на десятках языков, что упрощает добавление речи в приложения с глобальной аудиторией, такие как RSS-ленты, веб-сайты или видеоматериалы.

Пример. Преобразование текста статьи в речь и загрузка в виде файла MP3
Polly-1-Content_Creation@2x
Goanimate

«Amazon Polly предоставил пользователям GoAnimate возможность моментального озвучивания персонажей, которых они рисуют, используя нашу платформу. Это особенно полезно в ситуациях, когда закадровое озвучивание вживую невозможно выполнить из-за ограничений, связанных с отсутствием ресурсов или времени, например при создании видео на нескольких языках или для ускорения процесса утверждения на этапе предварительной подготовки. Речь эффективно интегрируется с богатым набором готовых к использованию анимационных ресурсов, что еще больше упрощает использование GoAnimate и обеспечивает нашим клиентам эффективность и требуемую скорость выхода на рынок».

Элвин Хунг, генеральный директор и основатель, GoAnimate

См. пример использования >>

Онлайн-обучение

Amazon Polly позволяет разработчикам добавлять в свои приложения улучшенные визуальные возможности, такие как анимация лиц, синхронизированная с речью, или выделение слов в стиле караоке. Amazon Polly упрощает запрос дополнительного потока метаданных с информацией о том, когда произносятся конкретные предложения, слова и звуки. Используя этот поток метаданных вместе со звуковым потоком синтезированного речевого сигнала, клиенты могут создавать динамические изображения анимационных персонажей и выделять текст в момент его произношения в приложении.

Пример: воспроизведение речи и выделение произносимого текста
Polly-4-Language-Learning@2x
Duolingo

«Я не могу придумать какие-либо другие варианты использования, для которых точное произношение было бы так же важно, как при изучении новых языков. Мы обнаружили, что голоса Amazon Polly не только имеют качественное звучание, но и подходят для обучения языку ничуть не меньше, чем естественная человеческая речь».

Северин Хакер, технический директор, Duolingo

Читать публикацию компании в блоге >>

Телефония

Amazon Polly позволяет контакт-центрам взаимодействовать с клиентами естественно звучащими голосами. Можно кэшировать и воспроизводить выходные голосовые сообщения Amazon Polly, чтобы делать подсказки вызывающим абонентам через системы интерактивного голосового ответа (IVR), такие как Amazon Connect. Кроме того, API Amazon Polly можно использовать для автоматизированной доставки в режиме реального времени таких сведений, как состояние сервисов, связанные с аккаунтом и счетами данные, адреса и контактная информация.

Пример: преобразование текста в речь для систем телефонии
Polly-2-Customer_Contact_Center@2x
bandwidth-hdr-logo

«Специалисты Bandwidth разработали быстрое, надежное и компактное приложение для преобразования текста в речь на основе Amazon Polly. Теперь мы можем использовать качественные голоса по низкой стоимости. Удивительно, но разработка этого нового сервиса потребовала минимум усилий».

Яннис Филипопулос, старший разработчик программного обеспечения, Bandwidth

Читать публикацию компании в блоге >>
Готовы приступить к разработке?
Начать работу с Amazon Polly
Есть вопросы?
Свяжитесь с нами