Вопросы и ответы по Amazon Polly
Общие вопросы
Вопрос. Что такое Amazon Polly?
Amazon Polly – это сервис для преобразования текста в естественную речь. Сервис Amazon Polly позволяет озвучивать существующие приложения с первоклассным качеством и использовать поддержку речевых интерфейсов в продуктах совершенно новых категорий, от мобильных приложений и автомобилей и до различных устройств и бытовых приборов. Amazon Polly включает в себя несколько десятков естественно звучащих голосов и поддерживает множество языков. Таким образом, пользователи могут выбрать подходящий голос и распространять свои приложения с поддержкой речевых интерфейсов в различных географических регионах. Сервис Amazon Polly прост в использовании – достаточно отправить текст, который необходимо конвертировать в речь, в API Amazon Polly, и Amazon Polly немедленно возвращает в приложение звуковой поток, который можно сразу воспроизвести или сохранить в стандартном аудиоформате, например MP3. Сервис Amazon Polly поддерживает теги языка разметки синтеза речи (SSML), такие как prosody, что позволяет регулировать скорость речи, интонации и громкость. Amazon Polly является безопасным сервисом, который предлагает все эти возможности при любом масштабе с низкими задержками. Сгенерированную сервисом Amazon Polly речь можно кэшировать и воспроизводить повторно без дополнительной платы. После регистрации Amazon Polly позволяет бесплатно конвертировать миллионы символов в месяц в течение первого года. Оплата Amazon Polly по факту использования, низкая стоимость обработки запросов и отсутствие ограничений на хранение и повторное использование голосовых выходных данных делают сервис экономичным средством синтеза речи для любых сфер применения.
Вопрос. Каковы преимущества использования сервиса Amazon Polly?
Amazon Polly можно использовать для обеспечения в приложении высококачественного речевого вывода. Этот экономичный сервис работает с очень малыми задержками, его можно применить практически для любого примера использования, без ограничений на хранение и повторное использование синтезированной речи.
Вопрос. Какие возможности предлагает сервис?
Можно управлять различными параметрами речи, такими как произношение, громкость голоса, интонация, скорость речи и т. д., используя стандартизированный язык разметки синтеза речи (SSML). Можно воспользоваться стилем Newscaster, чтобы синтезировать речь для некоторых нейронных голосов. В результате они будут звучать как голос теле- или радиодиктора. На основе метаданных, включенных в аудиопоток, можно определить, когда конкретные слова или предложения в тексте воспроизводятся для пользователя. Это позволяет разработчику синхронизировать графическое выделение и анимацию, такую как движение губ анимированного персонажа, с синтезированной речью. Вы можете изменить произношение определенных слов, таких как названия компаний, аббревиатуры, иностранные слова и неологизмы, например «P!nk», «ROTFL», «C’est la vie» (когда говорится без французского произношения), с помощью пользовательских лексиконов.
Вопрос. Что такое речевые метки?
Речевые метки предназначены для дополнения синтезированной речи, генерируемой из входного текста. Используя эти метаданные вместе с аудиопотоком синтезированного речевого сигнала, клиенты могут добавлять в свои приложения улучшенные визуальные возможности, например анимацию, синхронизированную с речью, или выделение текста в стиле караоке.
Amazon Polly генерирует речевые метки с помощью следующих четырех элементов:
- элемент предложения, который указывает произносимое предложение во входящем тексте;
- элемент слова, который указывает слово в тексте;
- элемент виземы, который описывает форму губ, соответствующую произносимому звуку;
- элемент SSML, который описывает элементы SSML, используемые в тексте.
Речевые метки реализуются в форме потока JSON (точнее, набора отдельных объектов JSON, разделенных новыми строками), который может содержать от одного до всех четырех указанных элементов при использовании способа синтезирования речи с параметром speech-mark-types. Подробную информацию см. в «Руководстве для разработчиков по Amazon Polly».
Вопрос. Каковы наиболее распространенные примеры использования этого сервиса?
С помощью Amazon Polly можно оживить приложение, добавив в него возможности естественной речи. Например, приложения, использующие возможности Amazon Polly по преобразованию текста в речь (TTS), можно создавать в сфере образовании и дистанционного обучения, чтобы помочь людям, которые не могут читать. Amazon Polly можно использовать, чтобы обеспечить доступ к цифровому контенту (электронным книгам, новостям и т. д.) слепым и слабовидящим людям. Сервис Amazon Polly можно использовать в информационных системах на общественном транспорте и в промышленных системах управления для оповещений и аварийных предупреждений. Возможности Amazon Polly по предоставлению звукового вывода могут использоваться на широком спектре устройств, таких как телевизионные приставки, умные часы, планшеты, смартфоны и устройства IoT. Amazon Polly можно использовать в телефонии для создания интерактивных систем ответа на телефонные звонки. Типовыми применениями облачных решений по преобразованию текста в речь (TTS), таких как Amazon Polly, являются игры-викторины, анимация, создание видеообразов или дикторского текста.
Вопрос. Как Amazon Polly взаимодействует с другими продуктами AWS?
Используя Amazon Polly в сочетании с Amazon Lex, разработчики могут создавать полноценный голосовой пользовательский интерфейс для приложений. В Amazon Connect речь Amazon Polly используется для создания облачного контактного центра с возможностью самостоятельного обслуживания. Кроме того, разработчики мобильных приложений и решений Интернета вещей (IoT) могут использовать Amazon Polly для добавления речевого вывода к собственным системам.
Вопрос. Каковы преимущества облачных решений по преобразованию текста в речь по сравнению с решениями, работающими на устройствах?
Встроенные в устройство решения по преобразованию текста в речь требуют значительных вычислительных ресурсов, в первую очередь мощного ЦПУ, большой оперативной памяти и доступного дискового пространства. Это может привести к более высоким затратам на разработку и более высокому потреблению энергии на устройствах, таких как планшеты, смартфоны и т. д. Выполняемое в облаке преобразование текста в речь, напротив, значительно снижает требования к локальным вычислительным ресурсам. При этом появляется возможность поддержки всех доступных языков и голосов с очень высоким качеством. Более того, исправления и улучшения речи сразу становятся доступны конечным пользователям без дополнительного обновления ПО на всех устройствах. Облачное преобразование текста в речь (TTS) не зависит от платформы, что сводит к минимуму время и трудоемкость разработки.
Вопрос. Как начать работу с Amazon Polly?
Нужно просто войти в аккаунт AWS и перейти в консоль сервиса Amazon Polly (она является частью консоли AWS). После этого можно с консоли вводить любой текст и прослушивать синтезированную речь или сохранять ее в виде аудиофайла.
Вопрос. В каких регионах доступен этот сервис?
Сведения обо всех регионах, в которых поддерживаются стандартные голоса Amazon Polly, см. в Списке региональных сервисов AWS. Нейронные голоса поддерживаются в следующих регионах: Восток США (Сев. Вирджиния), Запад США (Орегон), Канада (Центр), Азия и Тихий океан (Токио), Азия и Тихий океан (Сеул), Азия и Тихий океан (Сингапур), Азия и Тихий океан (Сидней), Африка (Кейптаун), ЕС (Лондон), ЕС (Франкфурт), ЕС (Ирландия) и AWS GovCloud (Запад США).
Вопрос. Какие языки программирования поддерживает сервис?
Amazon Polly поддерживает все языки программирования, включенные в SDK AWS (Java, Node.js, .NET, PHP, Python, Ruby, Go и C++) и AWS Mobile SDK (iOS/Android). Amazon Polly также поддерживает API HTTP, поэтому можно реализовать свой собственный уровень доступа.
Вопрос. Какие аудиоформаты поддерживает сервис?
С помощью Amazon Polly можно передавать звуковой поток пользователям в режиме, близком к режиму реального времени. Для оптимизации полосы частот и качества звука для приложения можно выбирать различные частоты дискретизации. Amazon Polly поддерживает звуковые потоки в форматах MP3, Vorbis и несжатом формате PCM.
Вопрос. Какие языки поддерживает сервис?
Полный перечень языков, поддерживаемых сервисом Amazon Polly, см. в документации.
Вопрос. Действуют ли лимиты AWS для сервиса Amazon Polly?
Для обеспечения доступности всех ресурсов AWS и сокращения риска чрезмерных расходов для новых клиентов AWS устанавливает для каждого аккаунта лимиты на использование сервисов. При использовании в приложении сервиса качественного преобразования текста в речь Amazon Polly в действие вступают лимиты по умолчанию, в том числе лимиты на ограничение полосы пропускания, количество операций и использование языка разметки синтеза речи (SSML). Подробнее см. в разделе Лимиты для Amazon Polly Руководства для разработчиков по Amazon Polly. При использовании Amazon Polly совместно с другими сервисами AWS, например с AWS Batch для эффективной обработки пакетных задач, можно максимально эффективно использовать Amazon Polly в рамках установленных лимитов сервиса.
Вопрос. Получил ли сервис Amazon Polly сертификацию HIPAA?
Ответ: Сервис Amazon Polly соответствует требованиям HIPAA и включен в договор делового партнерства AWS (AWS BAA). Если организация заключила с AWS договор BAA, сервис Amazon Polly будет использовать, раскрывать и хранить закрытую медицинскую информацию организации (PHI) только в соответствии с условиями договора AWS BAA, а не в соответствии с правилами, описанными в разделе «Конфиденциальность данных» на странице вопросов и ответов по Amazon Polly.
Вопрос. Как начать работу с фирменным голосом Amazon Polly?
Если вас интересует создание фирменного голоса с помощью Amazon Polly, обратитесь к менеджеру аккаунтов AWS или свяжитесь с нами для получения дополнительной информации.
Вопрос. Каковы стоимость и сроки создания фирменного голоса?
Каждый голос уникален, поэтому нам важно узнать как можно больше о ваших целях, чтобы точно определить объем работ по созданию фирменного голоса. Если вас интересует создание фирменного голоса с помощью Amazon Polly, обратитесь к менеджеру аккаунтов AWS или свяжитесь с нами для получения дополнительной информации.
Оплата
Вопрос. Сколько стоит использование Amazon Polly?
Ознакомьтесь с действующими ценами на странице цен на Amazon Polly.
Вопрос. Можно ли использовать сервис для создания статических голосовых подсказок, которые будут воспроизводиться многократно?
Да, можно. В сервисе нет ограничений на такое использование, и дополнительная плата за это взиматься не будет.
Вопрос. Можно ли использовать сервис для создания контента, который будет использоваться в системах массового оповещения (например, на вокзалах)?
Да, можно. В сервисе нет ограничений на такое использование, и дополнительная плата за это взиматься не будет.
Вопрос. Если я запрошу 1000 символов для преобразования в речь и запрошу речевые метки для этих же 1000 символов, будет ли начислена плата за 2000 символов?
Да. Плата будет взиматься за каждый запрос на преобразование в речь или речевые метки на основании количества символов, которое вы отправите в сервис.
Вопрос. Распространяется ли уровень бесплатного пользования AWS на Amazon Polly?
Да, в рамках уровня бесплатного пользования AWS работу с Amazon Polly можно начать бесплатно. После регистрации новые пользователи Amazon Polly могут ежемесячно в течение первых 12 месяцев бесплатно синтезировать миллионы символов. Ознакомьтесь с действующими ценами на странице цен на Amazon Polly.
Вопрос. Ваши цены указаны с учетом налогов?
Подробнее о налогах см. на странице со справкой по налогам при работе с Amazon Web Services.
Конфиденциальность данных
Вопрос. Сохраняются ли входные тексты, обработанные Amazon Polly, и как их использует AWS?
Сервис Amazon Polly может хранить и использовать обрабатываемые входные речевые и текстовые сообщения исключительно в целях предоставления и поддержки сервиса, развития и повышения качества работы Amazon Polly, а также других технологий машинного обучения и искусственного интеллекта Amazon. Применение пользовательского контента необходимо для непрерывного улучшения качества работы Amazon Polly, включая разработку и обучение связанных технологий. Мы не используем какие-либо данные, идентифицирующие личность, которые могут содержаться в контенте, в целях продвижения продуктов, услуг или рекламы в адрес клиента или конечных пользователей. Доверие клиентов, конфиденциальность и безопасность их контента являются главными приоритетами компании. Мы применяем соответствующие комплексные технические и физические средства контроля, включая шифрование хранимых и передаваемых данных, для предотвращения неавторизованного доступа к данным и контенту клиентов или их раскрытия и гарантируем, что использование этих данных соответствует нашим обязательствам перед клиентами. Подробнее см. на странице https://aws.amazon.com/compliance/data-privacy-faq/. Вы можете отказаться от использования вашего контента в целях развития и повышения качества Amazon Polly и других технологий Amazon на основе машинного обучения и искусственного интеллекта, воспользовавшись политикой отказа в AWS Organizations. Подробнее о том, как оформить отказ, см. на странице Managing AI services opt‑out policy.
Вопрос. Кто имеет доступ к контенту, обработанному и хранимому Amazon Polly?
Доступ к клиентскому контенту, обработанному Amazon Polly, получает только авторизованный персонал. Доверие клиентов, конфиденциальность и безопасность их контента являются главными приоритетами компании. Мы применяем соответствующие комплексные технические и физические средства контроля, включая шифрование хранимых и передаваемых данных, для предотвращения неавторизованного доступа к данным и контенту клиентов или их раскрытия и гарантируем, что использование этих данных соответствует нашим обязательствам перед клиентами. Подробнее см. на странице https://aws.amazon.com/compliance/data-privacy-faq/.
Вопрос. Принадлежит ли мне контент, обработанный и хранимый Amazon Polly?
Вы являетесь полноправным владельцем своего контента. Мы будем использовать его только с вашего разрешения.
Вопрос. Перемещается ли контент, обработанный Amazon Polly, за пределы региона AWS, в котором используется Amazon Polly?
Весь контент, обработанный Amazon Polly, шифруется и надежно хранится в регионе AWS, в котором используется сервис Amazon Polly. Определенная часть контента, обрабатываемая Amazon Polly, может храниться в другом регионе AWS, однако это происходит исключительно в целях постоянного развития и совершенствования сервиса Amazon Polly и других технологий машинного обучения и искусственного интеллекта Amazon. Если вы отказываетесь от использования вашего контента в целях развития и повышения качества Amazon Polly и других технологий Amazon на основе машинного обучения и искусственного интеллекта, обратившись в поддержку AWS, ваш контент не будет храниться в другом регионе AWS. Доверие клиентов, конфиденциальность и безопасность их контента являются главными приоритетами компании. Мы применяем соответствующие комплексные технические и физические средства контроля, включая шифрование хранимых и передаваемых данных, для предотвращения неавторизованного доступа к данным и контенту клиентов или их раскрытия и гарантируем, что использование этих данных соответствует нашим обязательствам перед клиентами. Подробнее см. на странице https://aws.amazon.com/compliance/data-privacy-faq/.
Вопрос. Можно ли использовать Amazon Polly вместе с веб-сайтами, программами или другими приложениями, которые ориентированы на детей в возрасте до 13 лет и подпадают под действие Закона о защите конфиденциальности детей в Интернете (COPPA)?
Да. При соблюдении условий использования Amazon Polly, согласившись с которыми, вы берете на себя обязательство предоставлять – в рамках COPPA – любые необходимые предупреждения и получать любое необходимое и поддающееся проверке согласие родителей, вы можете использовать Amazon Polly вместе с веб-сайтами, программами или другими приложениями, которые полностью или частично ориентированы на детей в возрасте до 13 лет.
Вопрос. Как определить, распространяется ли действие COPPA на мой веб-сайт, программу или приложение?
Для получения информации о требованиях COPPA и инструкций по определению того, распространяются ли требования COPPA на конкретный веб-сайт, программу или другое приложение, обратитесь непосредственно к ресурсам, предоставляемым и поддерживаемым Федеральной торговой комиссией США. На указанном веб-сайте также содержится информация о том, как определить, ориентирован ли сервис полностью или частично на детей в возрасте до 13 лет.
Вопрос. Кто является владельцем записей Polly?
Если вы сотрудничаете с AWS при создании записей, то такие выходные сообщения Polly принадлежат вам. Если входной текст для Polly принадлежит третьей стороне, мы требуем, чтобы у вас были права на его использование. Дополнительную информацию, а также сведения о том, как сервис обрабатывает ваш контент, см. в нашем Пользовательском соглашении.
Подробнее о ценах на Amazon Polly