Начать работу с Amazon Polly

Amazon Polly – это сервис, который превращает текст в естественную речь, позволяя разрабатывать говорящие приложения и создавать совершенно новые категории продуктов с поддержкой речевых интерфейсов. Amazon Polly – это сервис преобразования текста в речь, который с помощью продвинутых технологий глубокого обучения позволяет синтезировать речь, трудно отличимую от человеческой.

Сервис включает в себя множество естественно звучащих голосов для различных языков. Клиенты могут выбирать подходящие голоса и создавать приложения с поддержкой речевых интерфейсов для различных стран.

Язык Женский голос Мужской голос Образец текста
Английский Джоанна Мэттью Hello. Do you speak a foreign language? One language is never enough.
Датский Ная Мадс Hej. Taler du et fremmed sprog? Et sprog er aldrig nok.
Португальский (Бразилия) Витория Рикарду Oi. Você fala algum idioma estrangeiro? Somente um idioma nunca é bastante.
Испанский Пенелопа Мигель Hola. ¿Hablas algún idioma extranjero? Un solo idioma no es suficiente.
Японский Мизуки
Такуми こんにちは、外国語を話せますか? 世界にはたくさんの言語があります。
Корейский Со Ён   안녕하세요? 외국어를 구사하십니까? 이 세상에는 수많은 언어들이 있답니다。

Полный список голосов и языков, поддерживаемых Amazon Polly, см. здесь.


Дата

Название

Автор

9 ноября 2017 г. Modify the Timbre of Amazon Polly Voices with the New Vocal Tract SSML Feature Робин Даутрикорт, старший менеджер по продукту, Amazon Polly

19 октября 2017 г.

Convert Your Text into an MP3 File with Amazon Polly and a Simple Python Script Дзидас Мартинайтис, специалист по работе с данными, AWS

12 октября 2017 г.

Amazon Polly Expands to the Asia Pacific (Tokyo) Region and Adds Two New Voices Робин Даутрикорт, старший менеджер по продукту, Amazon Polly

29 сентября 2017 г.

Using Amazon Polly to Provide Real-Time Home Monitoring Alerts Шива К. Сьямала, старший разработчик, Y-Cam Solutions
30 августа 2017 г. How Amazon Polly Breathed Life into Dan Brown’s Digital Assistant Дамиан Даттон, генеральный директор и основатель, Beeliked

См. все публикации по теме Amazon Polly в блоге AI здесь.


Естественное звучание голоса

Естественное звучание голоса

Amazon Polly поддерживает множество языков и предлагает десятки естественно звучащих мужских и женских голосов с различными акцентами. Возможность беглого произношения текста на нескольких языках, предоставляемая сервисом Amazon Polly, позволяет обеспечить высокое качество выходного речевого сигнала и создавать приложения для пользователей со всего мира.

Простая интеграция

Простая интеграция

Amazon Polly позволяет легко добавить голос на свой веб-сайт, в мобильное приложение или устройство. При работе с Amazon Polly достаточно написать текст, который необходимо преобразовать в речь с помощью API Amazon Polly, после чего сервис сразу же направит обратно соответствующий аудиопоток. Если при использовании других решений требуется пройти длительный процесс утверждения, для использования Amazon Polly не нужно указывать, как именно в приложении будет использоваться сгенерированная Amazon Polly речь, или подписывать какие-либо дистрибьюторские соглашения: можно сразу приступить к работе с сервисом.

Хранение и повторное распространение аудиофайла с записанной речью

Хранение и повторное распространение аудиофайла с записанной речью

В отличие от других решений, которые требуют отчислений или взимают плату каждый раз, когда вы воспроизводите ранее сгенерированный аудиофайл, Amazon Polly позволяет воспроизводить файлы неограниченное количество раз без дополнительной платы. Бесплатное воспроизведение также относится к использованию аудиофайла в автономном режиме. Можно создавать аудиофайлы, содержащие речь, используя различные стандартные форматы, такие как MP3 и OGG, и хранить их на таких устройствах, как мобильные телефоны или устройства Интернета вещей (IoT) для воспроизведения в автономном режиме.

 

Низкая стоимость

Низкая стоимость

Оплата по факту использования, низкая стоимость преобразования символа и возможность неограниченного числа воспроизведений делают сервис Amazon Polly экономичным решением для синтеза речи практически в любом приложении.

Быстрый отклик

Быстрый отклик

Синтез естественной речи и обеспечение работы голосовых диалоговых интерфейсов требует минимального времени ответа. Приложения с поддержкой голосовой функции должны воспроизводить синтезированную речь без задержек.Задумайтесь о приложениях, в которых даются голосовые указания для навигации, приложения для электронного обучения, в которых учащимся даются устные инструкции, а также приложения, в которых для взаимодействия с пользователями используется диалог в реальном времени. Работа таких приложений будет эффективной, если ответы будут воспроизводиться без ощутимых задержек в диалоговом потоке. Даже если в API Amazon Polly отправляется длинный текст, сервис направляет обратно в приложение аудиопоток, а значит, воспроизводить голоса можно сразу. Такой тип динамичных устных ответов требуют доступ к гораздо большему количеству аудиофайлов, содержащих речь, чем то, которое может храниться на устройствах пользователей. Amazon Polly находится в облаке, обеспечивая пользователю доступ к разнообразной синтезированной речи. Amazon Polly позволяет приложению отвечать еще эффективнее, в том числе предоставлять данные в режиме реального времени.

Amazon Polly позволяет легко добавить голос в ваше видео, презентацию или интернет-курс. Amazon Polly может генерировать речь на 24 языках, что позволяет легко добавлять голоса в приложения, которыми пользуются во всем мире. С помощью Amazon Polly можно читать RSS-канал, новости или электронные сообщения, а также хранить синтезированную речь в виде аудиофайлов.

Создание контента
GoAnimate

«Amazon Polly предоставил пользователям GoAnimate возможность моментального озвучивания персонажей, которых они рисуют, используя нашу платформу. Это особенно полезно в ситуациях, когда закадровое озвучивание вживую невозможно выполнить из-за ограничений, связанных с отсутствием ресурсов или времени, например при создании видео на нескольких языках или на этапе подготовки для ускорения процесса утверждения. Речь эффективно интегрируется с богатым набором готовых к использованию анимационных ресурсов, что еще больше упрощает использование GoAnimate и обеспечивает нашим клиентам эффективность и требуемую скорость выхода на рынок».

Элвин Хунг, генеральный директор и основатель, GoAnimate


Amazon Polly позволяет разработчикам добавлять в свои приложения улучшенные визуальные возможности, такие как анимация лиц, синхронизированная с речью, или выделение слов в стиле караоке. Amazon Polly упрощает запрос дополнительного потока метаданных с информацией о том, когда произносятся конкретные предложения, слова и звуки. Используя этот поток метаданных вместе со звуковым потоком синтезированного речевого сигнала, клиенты могут создавать динамические изображения анимационных персонажей и выделять текст в момент его произношения в приложении.

Создание контента

«Мы стремимся сделать учебный класс на базе облака более интересным и эффективным для всех, включая пользователей с ограниченными физическими возможностями, не способными читать и писать. За счет интеграции сервиса Amazon Polly, преобразующего текст в высококачественную естественную речь, с нашим набором продуктов AppWriter мы смогли расширить возможности платформы обучения. Очень важно, чтобы наши пользователи в режиме реального времени видели выделение текста при его чтении вслух. С помощью речевых меток Polly AppWriter может предоставлять улучшенные возможности чтения, которые создают действительно равные условия для тех, у кого возникают трудности при чтении и письме».

Стефан Пал, исполнительный директор, Wizkids


Amazon Polly позволяет клиентским контакт-центрам воспроизводить ответы естественно звучащими голосами. Выходное голосовое сообщение Amazon Polly можно воспроизводить с помощью имеющихся систем интерактивного голосового ответа (IVR). Кроме того, API Amazon Polly можно использовать для автоматизированной доставки в режиме реального времени таких сведений, как состояние сервисов, связанные с аккаунтом и счетами данные, адреса и контактная информация.

Клиентский контакт-центр

«Специалисты Bandwidth разработали быстрое и надежное небольшое TTS-приложение на основе Amazon Polly. Теперь мы можем использовать качественные голоса по низкой стоимости. Удивительно, но разработка этого нового сервиса потребовала минимум усилий».

Яннис Филипопулос, старший разработчик программного обеспечения, Bandwidth


Amazon Polly создает возможности для новых примеров использования Интернета вещей (IoT), позволяя легко и недорого добавить голосовые функции в устройства IoT. Устройства IoT могут использовать речь для естественного воспроизведения ответов и уведомлений голосом, что делает приложения более доступными, а также позволяет пользователям воспринимать информацию, не глядя на экран. С помощью Amazon Polly можно создавать аудиофайлы и хранить их на устройствах для воспроизведения в автономном режиме.

Используйте AWS Lambda для создания предварительно подписанных URL-адресов Polly, основанных на событиях из процессора правил AWS IoT, затем используйте шлюз устройств для отправки этих URL-адресов на устройства IoT, позволяя им запросить естественную речь.

Интернет вещей (IoT)

«Проведенные нами исследования показали, что сегодня клиенты с меньшей вероятностью будут приобретать интеллектуальные решения для обеспечения безопасности с речевым интерфейсом, если голос в них звучит механически, как во многих конкурирующих с AWS сервисах. Нашим клиентам очень нравится, насколько естественно звучит голос Amazon Polly. Многие попросту думают, что с ними общается настоящий человек».

Девин Чавда, генеральный директор, Y-Cam Solutions


Amazon Polly можно использовать для повышения удобства работы с приложениями, предназначенными для обучения иностранным языкам. Например, конечные пользователи могут вводить фразы на иностранном языке в приложение и слушать, как они звучат, когда их произносит носитель языка. Amazon Polly поддерживает 24 языка, что открывает множество возможностей для преподавателей и учащихся.

Изучение языков
Duolingo

«Я не могу придумать какие-либо другие варианты использования, для которых точное произношение было бы так же важно, как при изучении новых языков. Мы обнаружили, что голоса Amazon Polly не только имеют качественное звучание, но и отлично подходят для обучения языку, как и естественная человеческая речь».

Северин Хакер, технический директор, Duolingo


Используя Amazon Polly, можно создавать и распространять доступную информацию в виде синтезированной речи для людей со слабым зрением. Таким образом, можно помочь людям, потерявшим зрение, работать с различным контентом, таким как новости, книги или сообщения электронной почты.

Королевский национальный институт слепых

«В настоящее время мы используем технологию преобразования речи в текст от Amazon для создания и распространения доступной информации, представленной в виде синтезированного аудиоконтента для многих наших клиентов B2B и B2C, среди которых есть коммунальные предприятия, финансовые учреждения, медиакомпании, а также другие компании, ориентированные на производство продукции для клиентов, например журналов и других печатных изданий. Мы с нетерпением ожидаем объявленного выхода Amazon Polly, который нам позволит повысить удобство работы этих клиентов, предоставляя невероятные возможности по воспроизведению реалистичных голосов, которые поразят и привлекут внимание нашей аудитории».

Джон Ворсфолд, руководитель отдела по реализации решений, Королевский национальный институт слепых

Начать работу с Amazon Polly очень просто. Войдите в консоль, чтобы начать генерировать речь из собственного текста всего за несколько щелчков мышью.

Начало работы