Teste o Amazon Polly

Cadastre-se em uma conta gratuita
Ou faça login no Console

O nível gratuito do Amazon Polly inclui 5 milhões de caracteres por mês pelos 12 primeiros meses, começando pela primeira solicitação para fala.

Consulte os detalhes do nível gratuito da AWS »


P: O que é o Amazon Polly?

O Amazon Polly é um serviço que transforma texto em falas realistas. O Amazon Polly permite que aplicações atuais usem um recurso de fala de alto nível e cria oportunidades para categorias totalmente novas de produtos com fala, que abrangem de aplicações móveis e veículos a dispositivos e eletrodomésticos. O Amazon Polly inclui dezenas de vozes realistas e aceita vários idiomas, o que permite selecionar a voz ideal e distribuir aplicações com recursos de fala em várias regiões diferentes. O Amazon Polly é fácil de usar. Basta enviar o texto a ser convertido em fala à API do Amazon Polly. A aplicação receberá imediatamente o stream de áudio do Amazon Polly para reprodução direta ou armazenamento em formato de arquivo de áudio padrão, como MP3. O Amazon Polly permite tags de Speech Synthesis Markup Language (SSML), como prosódia, o que permite ajustar a velocidade, o tom e o volume das falas. O Amazon Polly é um serviço seguro que oferece todos esses benefícios em grande escala e com baixa latência. É possível armazenar em cache e reproduzir a fala gerada pelo Amazon Polly sem custos adicionais. Após o cadastro, o Amazon Polly permite converter gratuitamente 5 milhões de caracteres ao mês durante o primeiro ano. A definição de preço com pagamento conforme o uso, o baixo custo por solicitação e a inexistência de restrições de armazenamento e reutilização da saída de fala do Amazon Polly fazem dele uma forma econômica de utilizar síntese de fala em qualquer lugar.

P: Por que devo usar o Amazon Polly?

Você pode usar o Amazon Polly para usar saídas de fala de alta qualidade em aplicações. Esse serviço econômico oferece tempos de resposta muito baixos e está disponível para praticamente qualquer caso de uso, sem restrições de armazenamento e reutilização das falas geradas.

P: Quais recursos estão disponíveis?

Você pode controlar vários aspectos da fala como pronúncia, volume, tom e velocidade, entre outros, usando Speech Synthesis Markup Language (SSML) padrão. Você pode detectar quando palavras ou frases específicas no texto estão sendo faladas para o usuário com base nos metadados inclusos no stream de áudio. Isso permite que o desenvolvedor sincronize destaque gráfico e animações, como os movimentos de lábios de um avatar, com a fala sintetizada. É possível modificar a pronúncia de palavras específicas como nomes de empresa, abreviações, palavras estrangeiras e neologismos como, "P!nk", "ROTFL", "C’est la vie" (quando falado por uma voz não francesa) usando léxicos personalizados.

P: O que são as aspas?

As aspas foram criadas para complementar a fala sintetizada gerada por meio do texto de entrada. Ao usar esses metadados junto com o stream de áudio de fala sintetizada, os clientes poderão disponibilizar às suas aplicações uma experiência visual otimizada, oferecendo recursos como animação sincronizada com a fala ou destaque em estilo de karaokê.

O Amazon Polly gera aspas usando os quatro seguintes elementos:

1) Frase, que indica um elemento de frase no texto de entrada a ser falado.

2) Palavra, que indica um elemento de palavra no texto.

3) Viseme, que descreve o formato dos lábios que corresponde ao som falado.

4) SSML, que descreve um elemento SSML usado no texto.

As aspas são fornecidas no formato de um fluxo JSON – especificamente, um conjunto de objetos JSON autônomos delimitados por novas linhas-– que contém de um a todos esses quatro elementos ao usar o método synthesize-speech com o parâmetro speech-mark-types. Você pode encontrar mais informações no Guia do desenvolvedor do Amazon Polly.

P: Quais são os casos de uso mais comuns para esse serviço?

O Amazon Polly permite que você dê vida às aplicações adicionando recursos de fala realistas. Por exemplo, você pode criar aplicações para e-learning e educação usando o recurso de conversão de texto em fala (TTS) do Amazon Polly para ajudar as pessoas com deficiências de leitura. O Amazon Polly pode ser usado para ajudar pessoas com deficiências visuais a consumir conteúdo digital (eBooks, notícias, etc.). Também é possível usar o Amazon Polly em sistemas de alto-falantes para anunciar notificações e emergências em sistemas de transporte público e controle industrial. Existe uma grande variedade de dispositivos como decodificadores, smartwatches, tablets, smartphones e dispositivos de IoT que pode utilizar o Amazon Polly para oferecer saída de áudio. O Amazon Polly pode ser usado em soluções de telefonia como voz para sistemas de resposta de voz interativa (IVR). Aplicações como quebra-cabeças, animações, avatars ou geração de narrativas são casos de uso comuns para soluções de TTS com base em nuvem como o Amazon Polly.

P: Como esse produto funciona com outros produtos da AWS?

A combinação com o Amazon Lex permite que os desenvolvedores criem interfaces completas de usuário com voz para suas aplicações. No Amazon Connect, a fala do Amazon Polly é usada para criar serviços de central de contatos, de autoatendimento e baseados na nuvem. Além disso, os desenvolvedores de soluções de aplicativos móveis e da Internet das Coisas (IoT) podem usar o Amazon Polly para adicionar saída falada a seus próprios sistemas.

P: Quais são as vantagens de uma solução de conversão de texto em fala com base na nuvem em relação a soluções de dispositivos?

As soluções de conversão de texto em fala em dispositivos exigem recursos de computação consideráveis, principalmente capacidade de CPU, RAM e espaço em disco para serem disponibilizadas nos dispositivos. Isso pode resultar em maior custo de desenvolvimento e consumo de energia em dispositivos como tablets, smartphones, etc. Por outro lado, a conversão de texto em fala na nuvem reduz drasticamente os requisitos de recursos locais. Com isso, é possível usar todas as linguagens e vozes disponíveis com a maior qualidade possível. Além disso, as correções e aprimoramentos das falas são disponibilizados instantaneamente a todos os usuários finais, sem necessidade de atualizações adicionais em todos os dispositivos. A conversão de texto em fala (TTS) na nuvem independe de plataforma, minimizando o tempo e os esforços de desenvolvimento.

P: Como faço para começar a usar o Amazon Polly?

Basta fazer login na sua conta da AWS e navegar até o console do Amazon Polly (que é parte do console da AWS). No console, você pode digitar qualquer texto e ouvir a fala gerada ou salvá-la como um arquivo de áudio.

P: Em quais regiões o serviço está disponível?

O Amazon Polly pode ser acessado em todo o mundo destas 14 regiões da AWS: Ásia-Pacífico (Mumbai), Ásia-Pacífico (Seul), Ásia-Pacífico (Cingapura), Ásia-Pacífico (Sydney), Ásia-Pacífico (Tóquio), Canadá (Central), UE (Frankfurt), UE (Irlanda), UE (Londres), América do Sul (São Paulo), Leste dos EUA (Norte da Virgínia), Leste dos EUA (Ohio), Oeste dos EUA (Norte da Califórnia) e Oeste dos EUA (Oregon).

P: Quais são as linguagens de programação compatíveis?

O Amazon Polly é compatível com todas as linguagens de programação incluídas no AWS SDK (Java, Node.js, .NET, PHP, Python, Ruby, Go e C++) e no AWS Mobile SDK (iOS/Android). Além disso, o Amazon Polly também aceita a API do HTTP, permitindo que você implemente sua própria camada de acesso.

P: Quais são os formatos de áudio compatíveis?

O Amazon Polly permite fazer streaming de áudio para os usuários em tempo quase real. Além disso, você pode escolher entre diversas taxas de amostragem para otimizar a largura de banda e a qualidade de áudio da aplicação. O Amazon Polly é compatível com os formatos de streaming de áudio MP3, Vorbis e PCM bruto.

P: Quais idiomas são oferecidos?

Inglês americano Holandês Coreano Espanhol americano
Inglês australiano Francês Polonês Sueco
Inglês britânico Francês canadense
Português Turco
Inglês indiano Alemão Português brasileiro
Norueguês
Inglês de Gales Islandês Romeno  
Galês Italiano Russo
  
Dinamarquês Japonês Espanhol castelhano
 

P: O Amazon Polly tem Service Limits da AWS?

Para ajudar a garantir a disponibilidade de recursos da AWS e minimizar o risco de faturamento para novos clientes, a AWS mantém Service Limits para cada conta. Ao usar o Amazon Polly para capacitar sua aplicação com saída de fala de alta qualidade, existirão Service Limits padrão, como limitações de controle de fluxo, operações e uso de SSML. Para obter detalhes, consulte Limits in Amazon Polly no Guia do desenvolvedor do Amazon Polly. A combinação do Amazon Polly com outros Serviços da AWS, como o AWS Batch para um eficiente processamento em lotes, pode ajudá-lo a aproveitar o Amazon Polly ao máximo dentro dos Service Limits mencionados.


P: Qual é o custo do Amazon Polly?

Consulte a página de definição de preço do Amazon Polly para obter informações de definição de preço atualizadas.

P: Posso usar o serviço para gerar frases estáticas que serão reproduzidas várias vezes?

Sim, você pode. O serviço permite esse uso sem custos adicionais.

P: Posso usar o serviço para gerar conteúdo para sistemas de notificação em massa (por exemplo, em uma estação de trem)?

Sim, você pode. O serviço permite esse uso sem custos adicionais.

P: Se eu solicitar que 1.000 caracteres sejam sintetizados e solicitar aspas com os mesmos 1.000 caracteres, serei cobrado por 2.000 caracteres?

Sim. Você será cobrado por cada solicitação de fala ou aspas com base no número de caracteres enviados para o serviço.

P: O Amazon Polly participa do nível gratuito da AWS?

Como parte do nível de uso gratuito da AWS, você pode começar a utilizar o Amazon Polly gratuitamente. Após a inscrição, os novos clientes do Amazon Polly poderão sintetizar até 5 milhões de caracteres gratuitamente por mês durante os primeiros 12 meses.

P: Os preços incluem impostos?

Para obter detalhes sobre impostos, consulte a Ajuda sobre impostos da Amazon Web Services.


P: O Amazon Polly usará meu conteúdo para aprimorar o serviço? Qual a política de privacidade do Amazon Polly?

O Amazon Polly pode usar seu conteúdo para aprimorar a qualidade dos serviços oferecidos e de outros produtos e serviços relacionados ao aprendizado de máquina e oferecidos pela AWS e suas afiliadas. Parte desse uso do seu conteúdo é essencial para a continuidade do desenvolvimento da tecnologia subjacente e o aprimoramento da experiência do cliente do Amazon Polly. A sua confiança, bem como a privacidade e a segurança do seu conteúdo, são a nossa maior prioridade. Implementamos controles técnicos e físicos responsáveis e sofisticados, projetados para evitar acesso não autorizado ou divulgação do seu conteúdo e garantir que o nosso uso esteja de acordo com os compromissos que assumimos com você. Para obter mais informações, consulte as perguntas frequentes sobre a privacidade de dados da AWS