Общие вопросы

Вопрос: Что такое Amazon Polly?

Amazon Polly – это сервис для преобразования текста в естественную речь. Сервис Amazon Polly позволяет озвучивать существующие приложения с первоклассным качеством и использовать поддержку речевых интерфейсов в продуктах совершенно новых категорий, от мобильных приложений и автомобилей и до различных устройств и бытовых приборов. Amazon Polly включает в себя несколько десятков естественно звучащих голосов и поддерживает множество языков. Таким образом, пользователи могут выбрать подходящий голос и распространять свои приложения с поддержкой речевых интерфейсов в различных географических регионах. Сервис Amazon Polly прост в использовании – достаточно отправить текст, который необходимо конвертировать в речь, в API Amazon Polly, и Amazon Polly немедленно возвращает в приложение звуковой поток, который можно сразу воспроизвести или сохранить в стандартном аудиоформате, например MP3. Сервис Amazon Polly поддерживает теги языка разметки синтеза речи (SSML), такие как prosody, что позволяет регулировать скорость речи, интонации и громкость. Amazon Polly является безопасным сервисом, который предлагает все эти возможности при любом масштабе с низкими задержками. Сгенерированную сервисом Amazon Polly речь можно кэшировать и воспроизводить повторно без дополнительной платы. Amazon Polly позволяет бесплатно конвертировать 5 млн символов в месяц в течение первого года после регистрации. Оплата Amazon Polly по факту использования, низкая стоимость обработки запросов и отсутствие ограничений на хранение и повторное использование голосовых выходных данных делают сервис экономным средством синтеза речи для любых сфер применения.

Вопрос: Каковы преимущества использования сервиса Amazon Polly?

Amazon Polly можно использовать для обеспечения в приложении высококачественного речевого вывода. Этот экономичный сервис работает с очень малыми задержками, его можно применить практически для любого примера использования, без ограничений на хранение и повторное использование синтезированной речи.

Вопрос: Какие возможности предлагает сервис?

Можно управлять различными параметрами речи, такими как произношение, громкость, высота голоса, скорость речи и т. д., с помощью стандартизированного языка разметки синтеза речи (SSML). На основе метаданных, включенных в аудиопоток, можно определить, когда конкретные слова или предложения в тексте воспроизводятся пользователю. Это позволяет разработчику синхронизировать графическое выделение и анимацию, такую как движение губ анимированного персонажа, с синтезированной речью. С использованием специальной лексики можно изменять произношение отдельных слов, таких как названия компаний, акронимы, иностранные слова и неологизмы, например «P!nk», «ROTFL», «C’est la vie» (при произнесении не по-французски).

Вопрос: Что такое речевые метки?

Речевые метки предназначены для дополнения синтезированной речи, генерируемой из входного текста. Используя эти метаданные вместе с аудиопотоком синтезированного речевого сигнала, клиенты могут добавлять в свои приложения улучшенные визуальные возможности, например анимацию, синхронизированную с речью, или выделение текста в стиле караоке.

Amazon Polly генерирует речевые метки с помощью следующих четырех элементов:

  1. элемент предложения, который указывает произносимое предложение во входящем тексте;
  2. элемент слова, который указывает слово в тексте;
  3. элемент виземы, который описывает форму губ, соответствующую произносимому звуку;
  4. элемент SSML, который описывает элементы SSML, используемые в тексте.

Речевые метки реализуются в форме потока JSON (точнее, набора отдельных объектов JSON, разделенных новыми строками), который может содержать от одного до всех четырех указанных элементов при использовании способа синтезирования речи с параметром speech-mark-types. Подробную информацию см. в «Руководстве для разработчиков по Amazon Polly».

Вопрос: Каковы наиболее распространенные примеры использования этого сервиса?

С помощью Amazon Polly можно оживить приложение, добавив в него возможности естественной речи. Например, приложения, использующие возможности Amazon Polly по преобразованию текста в речь (TTS), можно создавать в сфере образовании и дистанционного обучения, чтобы помочь людям, которые не могут читать. Amazon Polly можно использовать, чтобы обеспечить доступ к цифровому контенту (электронным книгам, новостям и т. д.) слепым и слабовидящим людям. Сервис Amazon Polly можно использовать в информационных системах на общественном транспорте и в промышленных системах управления для оповещений и аварийных предупреждений. Возможности Amazon Polly по предоставлению звукового вывода могут использоваться на широком спектре устройств, таких как телевизионные приставки, умные часы, планшеты, смартфоны и устройства IoT. Amazon Polly можно использовать в телефонии для создания интерактивных систем ответа на телефонные звонки. Типовыми применениями облачных решений по преобразованию текста в речь (TTS), таких как Amazon Polly, являются игры-викторины, анимация, создание видеообразов или дикторского текста.

Вопрос: Как Amazon Polly взаимодействует с другими продуктами AWS?

Используя Amazon Polly в сочетании с Amazon Lex, разработчики могут создавать полноценный голосовой пользовательский интерфейс для приложений. В Amazon Connect речь Amazon Polly используется для создания облачного контактного центра с возможностью самостоятельного обслуживания. Кроме этого, разработчики мобильных приложения и решений Интернета вещей (IoT) могут использовать Amazon Polly для добавления речевого вывода к собственным системам.

Вопрос: Каковы преимущества облачных решений по преобразования текста в речь по сравнению с решениями, работающими на устройствах?

Встроенные в устройство решения по преобразованию текста в речь требуют значительных вычислительных ресурсов, в первую очередь мощного ЦПУ, большой оперативной памяти и доступного дискового пространства. Это может привести к более высоким затратам на разработку и более высокому потреблению энергии на устройствах, таких как планшеты, смартфоны и т. д. Выполняемое в облаке преобразование текста в речь, напротив, значительно снижает требования к локальным вычислительным ресурсам. При этом появляется возможность поддержки всех доступных языков и голосов с очень высоким качеством. Более того, исправления и улучшения речи сразу становятся доступны конечным пользователям без дополнительного обновления ПО на всех устройствах. Облачное преобразование текста в речь (TTS) не зависит от платформы, что сводит к минимуму время и трудоемкость разработки.

Вопрос: Как начать работу с Amazon Polly?

Нужно просто войти в аккаунт AWS и перейти в консоль сервиса Amazon Polly (она является частью консоли AWS). После этого можно с консоли вводить любой текст и прослушивать синтезированную речь или сохранять ее в виде аудиофайла.

Вопрос: Какие языки программирования поддерживает сервис?

Amazon Polly поддерживает все языки программирования, включенные в SDK AWS (Java, Node.js, .NET, PHP, Python, Ruby, Go и C++) и AWS Mobile SDK (iOS/Android). Amazon Polly также поддерживает API HTTP, поэтому можно реализовать свой собственный уровень доступа.

Вопрос: Какие аудиоформаты поддерживает сервис?

С помощью Amazon Polly можно передавать звуковой поток пользователям в режиме, близком к режиму реального времени. Для оптимизации полосы частот и качества звука для приложения можно выбирать различные частоты дискретизации. Amazon Polly поддерживает звуковые потоки в форматах MP3, Vorbis и несжатом формате PCM.

Вопрос: Какие языки поддерживает сервис?

Полный перечень языков, поддерживаемых сервисом Amazon Polly, см. в документации.

Вопрос: Действуют ли лимиты AWS для сервиса Amazon Polly?

Для обеспечения доступности всех ресурсов AWS и сокращения риска чрезмерных расходов для новых клиентов AWS устанавливает для каждого аккаунта лимиты на использование сервисов. При использовании в приложении сервиса качественного преобразования текста в речь Amazon Polly в действие вступают лимиты по умолчанию, в том числе лимиты на ограничение полосы пропускания, количество операций и использование языка Speech Synthesis Markup Language (SSML). Подробнее см. в разделе Лимиты для Amazon Polly Руководства для разработчиков по Amazon Polly. При использовании Amazon Polly совместно с другими сервисами AWS, например с AWS Batch для эффективной обработки пакетных задач, можно максимально эффективно использовать Amazon Polly в рамках установленных лимитов сервиса.

Вопрос: Получил ли сервис Amazon Polly сертификацию HIPAA?

Ответ: Сервис Amazon Polly соответствует требованиям HIPAA и включен в договор делового партнерства AWS (AWS BAA). Если организация заключила с AWS договор BAA, сервис Amazon Polly будет использовать, раскрывать и хранить закрытую медицинскую информацию организации (PHI) только в соответствии с условиями договора AWS BAA, а не в соответствии с правилами, описанными в разделе «Конфиденциальность данных» на странице вопросов и ответов по Amazon Polly.

Оплата

Вопрос: Сколько стоит использование Amazon Polly?

Ознакомьтесь с действующими ценами на странице цен на Amazon Polly.

Вопрос: Можно ли использовать сервис для создания статических голосовых подсказок, которые будут воспроизводиться многократно?

Да, можно. В сервисе нет ограничений на такое использование, и дополнительная плата за это взиматься не будет.

Вопрос: Можно ли использовать сервис для создания контента, который будет использоваться в системах массового оповещения (например, на вокзалах)?

Да, можно. В сервисе нет ограничений на такое использование, и дополнительная плата за это взиматься не будет.

Вопрос: Если я запрошу 1000 символов для преобразования в речь и запрошу речевые метки для этих же 1000 символов, будет ли начислена плата за 2000 символов?

Да. Плата будет взиматься за каждый запрос на преобразование в речь или речевые метки на основании количества символов, которое вы отправите в сервис.

Вопрос: Распространяется ли уровень бесплатного пользования AWS на Amazon Polly?

Да, в рамках уровня бесплатного пользования AWS работу с Amazon Polly можно начать бесплатно. После регистрации новые пользователи Amazon Polly могут бесплатно синтезировать до 5 млн символов ежемесячно в течение первых 12 месяцев.

Вопрос. Ваши цены указаны с учетом налогов?

Подробнее о налогах см. на странице со справкой по налогам при работе с Amazon Web Services.

Конфиденциальность данных

Вопрос: Сохраняются ли входные тексты, обработанные Amazon Polly, и как их использует AWS?

Сервис Amazon Polly может хранить и использовать обрабатываемые входные речевые и текстовые сообщения исключительно в целях предоставления и поддержки сервиса, развития и повышения качества работы Amazon Polly, а также других технологий машинного обучения и искусственного интеллекта Amazon. Применение пользовательского контента необходимо для непрерывного улучшения качества работы Amazon Polly, включая разработку и обучение связанных технологий. Мы не используем какие-либо данные, идентифицирующие личность, которые могут содержаться в контенте, в целях продвижения продуктов, услуг или рекламы в адрес клиента или конечных пользователей. Доверие клиентов, конфиденциальность и безопасность их контента являются главными приоритетами компании. Мы применяем соответствующие комплексные технические и физические средства контроля, включая шифрование хранимых и передаваемых данных, для предотвращения неавторизованного доступа к данным и контенту клиентов или их раскрытия, и гарантируем, что использование этих данных соответствует нашим обязательствам перед клиентами. Подробнее см. на странице https://aws.amazon.com/compliance/data-privacy-faq/

Вопрос: Кто имеет доступ к контенту, обработанному и хранимому Amazon Polly?

Доступ к клиентскому контенту, обработанному Amazon Polly, получает только авторизованный персонал. Доверие клиентов, конфиденциальность и безопасность их контента являются главными приоритетами компании. Мы применяем соответствующие комплексные технические и физические средства контроля, включая шифрование хранимых и передаваемых данных, для предотвращения неавторизованного доступа к данным и контенту клиентов или их раскрытия, и гарантируем, что использование этих данных соответствует нашим обязательствам перед клиентами. Подробнее см. на странице https://aws.amazon.com/compliance/data-privacy-faq/

Вопрос: Принадлежит ли мне контент, обработанный и хранимый Amazon Polly?

Вы являетесь полноправным владельцем своего контента. Мы будем использовать его только с вашего разрешения.

Вопрос: Перемещается ли контент, обработанный Amazon Polly, за пределы региона AWS, в котором используется Amazon Polly?

Весь контент, обработанный Amazon Polly, шифруется и надежно хранится в регионе AWS, в котором используется сервис Amazon Polly. Определенная часть контента, обрабатываемая Amazon Polly, может храниться в другом регионе AWS, однако это происходит исключительно в целях постоянного развития и совершенствования сервиса Amazon Polly и других технологий машинного обучения и искусственного интеллекта Amazon. Доверие клиентов, конфиденциальность и безопасность их контента являются главными приоритетами компании. Мы применяем соответствующие комплексные технические и физические средства контроля, включая шифрование хранимых и передаваемых данных, для предотвращения неавторизованного доступа к данным и контенту клиентов или их раскрытия, и гарантируем, что использование этих данных соответствует нашим обязательствам перед клиентами. Подробнее см. на странице https://aws.amazon.com/compliance/data-privacy-faq/

Вопрос: Можно ли использовать Amazon Polly вместе с веб-сайтами, программами или другими приложениями, которые ориентированы на детей в возрасте до 13 лет и подпадают под действие Закона о защите конфиденциальности детей в Интернете (COPPA)?

Да. При соблюдении условий использования Amazon Polly, согласившись с которыми вы берете на себя обязательство предоставлять – в рамках COPPA – любые необходимые предупреждения и получать любое необходимое и поддающееся проверке согласие родителей, вы можете использовать Amazon Polly вместе с веб-сайтами, программами или другими приложениями, которые полностью или частично ориентированы на детей в возрасте до 13 лет.

Скрыть

Вопрос: Как определить, распространяется ли действие COPPA на мой веб-сайт, программу или приложение?

Для получения информации о требованиях COPPA и инструкциях по определению того, распространяются ли требования COPPA на конкретный веб-сайт, программу или другое приложение, обратитесь непосредственно к ресурсам, предоставляемым и поддерживаемым Федеральной торговой комиссией США. На указанном сайте также содержится информация о том, как определить, ориентирован ли сервис полностью или частично на детей в возрасте до 13 лет.

Подробнее о ценах на Amazon Polly

Перейти на страницу цен
Готовы начать работу?
Регистрация
Есть вопросы?
Свяжитесь с нами