Amazon Polly – сервис, преобразующий текст в естественную речь. Amazon Polly позволяет разрабатывать говорящие приложения и создавать совершенно новые категории продуктов с поддержкой речевых интерфейсов. Amazon Polly – это один из сервисов Amazon AI, в котором с помощью продвинутых технологий глубокого обучения можно синтезировать речь, похожую на человеческую. Amazon Polly включает в себя несколько десятков естественно звучащих голосов для множества языков. Таким образом, пользователи могут выбирать подходящие голоса и создавать приложения с поддержкой речевых интерфейсов для различных стран.
Скорость предоставления ответов в Amazon Polly держится на достаточно высоком уровне, что позволяет обеспечить живой диалог в режиме реального времени. Речь, сгенерированную Amazon Polly, можно кэшировать и сохранять в виде аудиофайлов, чтобы потом воспроизводить в автономном режиме или распространять. Пользоваться Amazon Polly очень просто. Достаточно отправить в API Amazon Polly текст, который необходимо преобразовать в речь, и сервис сразу же направит обратно в приложение соответствующий аудиопоток. Его можно воспроизвести или сохранить в стандартном аудиоформате, например MP3.
При использовании Amazon Polly вы платите только за символы, которые были преобразованы в речь, при этом речь, сгенерированную Amazon Polly, можно сохранять и воспроизводить повторно. Благодаря низкой стоимости преобразования символа, а также отсутствию ограничений на хранение и повторное использование выходных аудиофайлов Amazon Polly представляет собой экономичное решение, позволяющее выполнять преобразование текста в речь где угодно.
Для просмотра видео на этом сайте требуется Adobe Flash Player или любой современный браузер.
| Язык | Женский голос | Мужской голос | Образец текста |
| Английский | Джоанна | Джоуи | Hello. Do you speak a foreign language? One language is never enough. |
| Датский | Ная | Мадс | Hej. Taler du et fremmed sprog? Et sprog er aldrig nok. |
| Португальский (Бразилия) | Витория | Рикарду | Oi. Você fala algum idioma estrangeiro? Somente um idioma nunca é bastante. |
| Испанский | Пенелопа | Мигель | Hola. ¿Hablas algún idioma extranjero? Un solo idioma no es suficiente. |
| Исландский | Дора | Карл | Halló, Hæ talar þú erlent tungumál? Eitt tungumál er aldrei nóg. |
Естественное звучание голоса
Amazon Polly поддерживает множество языков и предлагает десятки естественно звучащих мужских и женских голосов с различными акцентами. Возможность беглого произношения текста на нескольких языках, предоставляемая сервисом Amazon Polly, позволяет обеспечить высокое качество выходного речевого сигнала и создавать приложения для пользователей со всего мира.
Простая интеграция
Amazon Polly позволяет легко добавить голос на свой веб-сайт, в мобильное приложение или устройство. При работе с Amazon Polly достаточно написать текст, который необходимо преобразовать в речь с помощью API Amazon Polly, после чего сервис сразу же направит обратно соответствующий аудиопоток. Если при использовании других решений требуется пройти длительный процесс утверждения, для использования Amazon Polly не нужно указывать, как именно в приложении будет использоваться сгенерированная Amazon Polly речь, или подписывать какие-либо дистрибьюторские соглашения: можно сразу приступить к работе с сервисом.
Хранение и повторное распространение аудиофайла с записанной речью
В отличие от других решений, которые требуют отчислений или взимают плату каждый раз, когда вы воспроизводите ранее сгенерированный аудиофайл, Amazon Polly позволяет воспроизводить файлы неограниченное количество раз без дополнительной платы. Бесплатное воспроизведение также относится к использованию аудиофайла в автономном режиме. Можно создавать аудиофайлы, содержащие речь, используя различные стандартные форматы, такие как MP3 и OGG, и хранить их на таких устройствах, как мобильные телефоны или устройства Интернета вещей (IoT) для воспроизведения в автономном режиме.
Низкая стоимость
Оплата по факту использования, низкая стоимость преобразования символа и возможность неограниченного числа воспроизведений делают сервис Amazon Polly экономичным решением для синтеза речи практически в любом приложении.
Быстрый отклик
Синтез естественной речи и обеспечение работы голосовых диалоговых интерфейсов требует минимального времени ответа. Приложения с поддержкой голосовой функции должны воспроизводить синтезированную речь без задержек.Задумайтесь о приложениях, в которых даются голосовые указания для навигации, приложения для электронного обучения, в которых учащимся даются устные инструкции, а также приложения, в которых для взаимодействия с пользователями используется диалог в реальном времени. Работа таких приложений будет эффективной, если ответы будут воспроизводиться без ощутимых задержек в диалоговом потоке. Даже если в API Amazon Polly отправляется длинный текст, сервис направляет обратно в приложение аудиопоток, а значит, воспроизводить голоса можно сразу. Такой тип динамичных устных ответов требуют доступ к гораздо большему количеству аудиофайлов, содержащих речь, чем то, которое может храниться на устройствах пользователей. Amazon Polly находится в облаке, обеспечивая пользователю доступ к разнообразной синтезированной речи. Amazon Polly позволяет приложению отвечать еще эффективнее, в том числе предоставлять данные в режиме реального времени.
Amazon Polly позволяет легко добавить голос в ваше видео, презентацию или интернет-курс. Amazon Polly может генерировать речь на 24 языках, что позволяет легко добавлять голоса в приложения, которыми пользуются во всем мире. С помощью Amazon Polly можно читать RSS-канал, новости или электронные сообщения, а также хранить синтезированную речь в виде аудиофайлов.
«Amazon Polly предоставил пользователям GoAnimate возможность моментального озвучивания персонажей, которых они рисуют, используя нашу платформу. Это особенно полезно в ситуациях, когда закадровое озвучивание вживую невозможно выполнить из-за ограничений, связанных с отсутствием ресурсов или времени, например при создании видео на нескольких языках или на этапе подготовки для ускорения процесса утверждения. Речь эффективно интегрируется с богатым набором готовых к использованию анимационных ресурсов, что еще больше упрощает использование GoAnimate и обеспечивает нашим клиентам эффективность и требуемую скорость выхода на рынок».
Элвин Хунг, генеральный директор и основатель, GoAnimate
Amazon Polly позволяет разработчикам добавлять в свои приложения улучшенные визуальные возможности, такие как анимация лиц, синхронизированная с речью, или выделение слов в стиле караоке. Amazon Polly упрощает запрос дополнительного потока метаданных с информацией о том, когда произносятся конкретные предложения, слова и звуки. Используя этот поток метаданных вместе со звуковым потоком синтезированного речевого сигнала, клиенты могут создавать динамические изображения анимационных персонажей и выделять текст в момент его произношения в приложении.
«Мы стремимся сделать учебный класс на базе облака более интересным и эффективным для всех, включая пользователей с ограниченными физическими возможностями, не способными читать и писать. За счет интеграции сервиса Amazon Polly, преобразующего текст в высококачественную естественную речь, с нашим набором продуктов AppWriter мы смогли расширить возможности платформы обучения. Очень важно, чтобы наши пользователи в режиме реального времени видели выделение текста при его чтении вслух. С помощью речевых меток Polly AppWriter может предоставлять улучшенные возможности чтения, которые создают действительно равные условия для тех, у кого возникают трудности при чтении и письме».
Стефан Пал, исполнительный директор, Wizkids
Amazon Polly позволяет легко добавить голос в мобильные приложения и игры. Amazon Polly позволяет хранить на устройстве стандартные голосовые ответы, а также использовать динамические ответы, синтезируемые в режиме реального времени, например диалог между персонажами в игре, положение в турнирной таблице и приглашения начать игру.
«Ежедневно мы выпускаем более 1200 статей, и нас давно интересовало создание их аудиоверсий. Тем не менее прежде стоимость решений для преобразования текста в речь не соответствовала предлагаемому качеству. С появлением сервиса Amazon Polly и его высококачественных голосов мы планируем предложить читателям более интересные и разнообразные способы знакомства с нашими материалами».
Джозеф Прайс, старший менеджер по продукции, The Washington Post
Amazon Polly позволяет клиентским контакт-центрам воспроизводить ответы естественно звучащими голосами. Выходное голосовое сообщение Amazon Polly можно воспроизводить с помощью имеющихся систем интерактивного голосового ответа (IVR). Кроме того, API Amazon Polly можно использовать для автоматизированной доставки в режиме реального времени таких сведений, как состояние сервисов, связанные с аккаунтом и счетами данные, адреса и контактная информация.
Amazon Polly создает возможности для новых примеров использования Интернета вещей (IoT), позволяя легко и недорого добавить голосовые функции в устройства IoT. Устройства IoT могут использовать речь для естественного воспроизведения ответов и уведомлений голосом, что делает приложения более доступными, а также позволяет пользователям воспринимать информацию, не глядя на экран. С помощью Amazon Polly можно создавать аудиофайлы и хранить их на устройствах для воспроизведения в автономном режиме.
Используйте AWS Lambda для создания предварительно подписанных URL-адресов Polly, основанных на событиях из процессора правил AWS IoT, затем используйте шлюз устройств для отправки этих URL-адресов на устройства IoT, позволяя им запросить естественную речь.
Amazon Polly можно использовать для повышения удобства работы с приложениями, предназначенными для обучения иностранным языкам. Например, конечные пользователи могут вводить фразы на иностранном языке в приложение и слушать, как они звучат, когда их произносит носитель языка. Amazon Polly поддерживает 24 языка, что открывает множество возможностей для преподавателей и учащихся.
«Я не могу придумать какие-либо другие варианты использования, для которых точное произношение было бы так же важно, как при изучении новых языков. Мы обнаружили, что голоса Amazon Polly не только имеют качественное звучание, но и отлично подходят для обучения языку, как и естественная человеческая речь».
Северин Хакер, технический директор, Duolingo
Используя Amazon Polly, можно создавать и распространять доступную информацию в виде синтезированной речи для людей со слабым зрением. Таким образом, можно помочь людям, потерявшим зрение, работать с различным контентом, таким как новости, книги или сообщения электронной почты.
«В настоящее время мы используем технологию преобразования речи в текст от Amazon для создания и распространения доступной информации, представленной в виде синтезированного аудиоконтента для многих наших клиентов B2B и B2C, среди которых есть коммунальные предприятия, финансовые учреждения, медиакомпании, а также другие компании, ориентированные на производство продукции для клиентов, например журналов и других печатных изданий. Мы с нетерпением ожидаем объявленного выхода Amazon Polly, который нам позволит повысить удобство работы этих клиентов, предоставляя невероятные возможности по воспроизведению реалистичных голосов, которые поразят и привлекут внимание нашей аудитории».
Джон Ворсфолд, руководитель отдела по реализации решений, Королевский национальный институт слепых
Начать работу с Amazon Polly очень просто. Войдите в консоль, чтобы начать генерировать речь из собственного текста всего за несколько щелчков мышью.




