Amazon Polly – это генератор голоса на базе искусственного интеллекта
Используйте высококачественные, естественно звучащие человеческие голоса на десятках языковЧто такое Amazon Polly?
Amazon Polly – это полностью управляемый сервис, который генерирует голос по запросу и преобразует любой текст в аудиопоток. Использование технологий глубокого обучения для преобразования статей, веб-страниц, PDF-документов и другого текста в речь (TTS). Polly предоставляет десятки реалистичных голосов на широком наборе языков, чтобы вы могли создавать приложения с функцией речевой активации, конвертации и вовлеченности. Удовлетворяйте различные языковые запросы, потребности в доступности и обучении пользователей из разных регионов и рынков. Мощные нейронные сети и генеративные голосовые движки работают в фоновом режиме, синтезируя речь за вас. Интегрируйте API Amazon Polly в существующие приложения, чтобы быстро приступить к синтезу речи.
Примеры использования
Возможности
Amazon Polly обладает различными возможностями, включая перечисленные ниже.
Реалистичные голоса
Обеспечьте диалоговое взаимодействие пользователей с неизменно быстрым откликом
Запрашивая выходные данные Amazon Polly, можно выбирать из десятков реалистичных голосов на разных языках. Каждый голос создан при помощи носителей языка с вариациями от голоса к голосу даже на одном языке. Большинство языков поддерживают один или несколько мужских и женских голосов, что дает возможность выбора наиболее подходящего голоса для отдельного варианта использования.
Настраиваемые выходные данные
Получите возможность настройки речевых выходных данных и управления ими
Amazon Polly предоставляет возможность создавать собственные выходные данные преобразования текста в речь, привлекающие и удерживающие внимание аудитории. Используйте пользовательский лексикон для изменения произношения акронимов, названий компаний, внутренней терминологии или любых других выбранных слов. Теги языков разметки синтеза речи (SSML) Amazon Polly также предоставляют возможность менять ударение, интонацию, фразировку и стиль. Создавайте голосовые выходные данные с помощью искусственного интеллекта, наиболее подходящие для вашего бизнеса.
Мощность генеративного искусственного интеллекта
Получите доступ ко встроенным возможностям генеративного искусственного интеллекта по доступной цене
Amazon Polly поддерживает несколько голосовых движков, доступных для преобразования текста в речь. Движок развертывает трансформер с миллиардом параметров, позволяющий генерировать голоса поэтапно и с возможностью потоковой передачи. Этот генератор голоса с искусственным интеллектом создает синтетическую речь, похожую на настоящий человеческий голос: убедительную, эмоционально насыщенную и разговорную по своей природе.
Контроль и безопасность
Безопасное хранение и распространение речи в стандартных форматах
Сохраняйте выходные данные преобразования текста в речь в стандартных форматах аудиофайлов, таких как MP3 и OGG, для распространения, анализа, архивирования или любого другого варианта использования без дополнительной платы. Кэшируйте файлы для более быстрого извлечения при необходимости. Безопасность пользовательского контента, доверие и конфиденциальность – главные приоритеты AWS. Amazon Polly не сохраняет содержимое отправленных текстовых сообщений.