Amazon Polly

Transforme texto em falas realistas usando o aprendizado profundo

Ouça o Amazon Polly >>

O Amazon Polly é um serviço que transforma texto em falas realistas, permitindo criar aplicativos que falam e definir categorias totalmente novas de produtos compatíveis com fala. O Amazon Polly é um serviço de conversão de texto em fala que usa tecnologias avançadas de aprendizado profundo para sintetizar falas que soam como a voz humana.

O Amazon Polly inclui dezenas de vozes realistas em vários idiomas, o que permite selecionar a voz ideal e criar aplicativos com recursos de fala que funcionam em vários países diferentes.

Introdução ao Amazon Polly
Idioma Feminino Masculino Amostra de texto
Inglês Joanna Matthew Hello. Do you speak a foreign language? One language is never enough.
Dinamarquês Naja Mads Hej. Taler du et fremmed sprog? Et sprog er aldrig nok.
Português do Brasil Vitória Ricardo Oi. Você fala algum idioma estrangeiro? Somente um idioma nunca é bastante.
Espanhol Penélope Miguel Hola. ¿Hablas algún idioma extranjero? Un solo idioma no es suficiente.no
Francês Léa Mathieu Bonjour. Parlez-vous une autre langue que le français? Une langue n'est jamais assez.
Japonês Mizuki
Takumi こんにちは、外国語を話せますか? 世界にはたくさんの言語があります。
Coreano Seoyeon   안녕하세요? 외국어를 구사하십니까? 이 세상에는 수많은 언어들이 있답니다。
Confira a lista completa de vozes e idiomas para os quais o Amazon Polly oferece suporte aqui.

Benefícios

Vozes com som natural

O Amazon Polly oferece dezenas de idiomas e uma ampla seleção de vozes masculinas e femininas com som natural. A pronúncia fluida de texto do Amazon Polly permite gerar saída de voz de alta qualidade para um público global.

Armazene e redistribua as falas

O Amazon Polly permite reproduções ilimitadas das falas geradas, sem taxas adicionais. Você pode criar arquivos de fala em formatos padrão, como MP3 e OGG, e enviá-los da nuvem ou localmente com aplicativos ou dispositivos para reprodução offline.

Streaming em tempo real

A entrega de vozes realistas e experiências de usuário conversacionais exige tempos de resposta consistentemente rápidos. Sempre que você envia um texto longo à API do Amazon Polly, o áudio é retornado ao aplicativo como um stream, o que permite reproduzir imediatamente as vozes. 

Personalize e controle a saída de falas

Modifique as vozes do Amazon Polly de acordo com as suas necessidades. O Amazon Polly oferece suporte a léxicos e tags SSML, que permite controlar aspectos da fala como pronúncia, volume, tom, velocidade, etc.  

 

 

Baixo custo

A definição de preço com pagamento conforme o uso, o baixo custo por caractere convertido e as reproduções ilimitadas do Amazon Polly fazem dele uma alternativa econômica para adicionar voz a aplicativos.

Casos de uso

Criação de conteúdo

O áudio pode ser usado como mídia complementar para comunicação escrita e/ou visual. A disponibilização do conteúdo em voz oferece ao público uma forma alternativa de consumir informações e atender às necessidades de um grande grupo de leitores. O Amazon Polly pode gerar falas em dezenas de idiomas, facilitando a adição de fala a aplicativos com público global, como feeds RSS, sites ou vídeos.

Exemplo: converter um artigo em fala e fazer download dessa fala como MP3
Polly-1-Content_Creation@2x
Goanimate

“O Amazon Polly oferece aos usuários do GoAnimate o recurso de dar imediatamente voz aos personagens animados em nossa plataforma. Isso é particularmente útil em cenários em que a narração ao vivo exige muitos recursos ou muito tempo, como no desenvolvimento de um vídeo em diversos idiomas ou na fase de pré-produção para acelerar o processo de aprovação. A fala é integrada diretamente ao nosso conjunto sofisticado de ativos pré-animados, o que reforça a facilidade de uso do GoAnimate e proporciona aos nossos clientes eficiência e velocidade de acesso ao mercado.”

– Alvin Hung, diretor executivo e fundador, GoAnimate

Consulte o estudo de caso >>

E-learning

O Amazon Polly permite que desenvolvedores disponibilizem suas aplicações com uma experiência visual otimizada, oferecendo recursos como animação facial sincronizada com a fala ou destaque de palavras em estilo de karaokê. O Amazon Polly torna fácil solicitar streams adicionais de metadados com informações sobre quando frases, palavras e sons específicos estão sendo pronunciados. Ao usar esses streams de metadados junto com streams de áudio de fala sintetizada, os clientes poderão animar avatares e destacar textos à medida que o texto for falado (lido ao vivo) em suas aplicações.

Exemplo: reproduzir falas e destacar texto falado
Polly-4-Language-Learning@2x
Duolingo

“Não consigo pensar em muitos casos de uso em que a pronúncia precisa seja mais importante que no aprendizado de um novo idioma. Constatamos que as vozes do Amazon Polly, além de terem alta qualidade, são tão eficientes quanto a fala humana natural para ensinar um idioma.”

– Severin Hacker, diretor de tecnologia, Duolingo

Leia a postagem do blog >>

Telefonia

Com o Amazon Polly, as centrais de atendimento aos clientes podem interagir com os clientes com vozes que soam naturais. Você pode armazenar em cache e reproduzir a saída de fala do Amazon Polly para interagir com os chamadores por meio de sistemas de Interactive Voice Response (IVR – Resposta por voz interativa), como o Amazon Connect. Além disso, você pode usar a API do Amazon Polly para disponibilizar automaticamente informações em tempo real, como status de serviços, consultas de contas e faturamento, endereços e informações de contato.

Por exemplo: conversão de texto em fala para sistemas de telefonia
Polly-2-Customer_Contact_Center@2x
bandwidth-hdr-logo

“A Bandwidth criou um aplicativo de TTS pequeno, confiável e rápido usando o Amazon Polly. Agora, estamos usando vozes de alta qualidade com baixo custo. O esforço de desenvolvimento necessário para criar esse novo serviço foi surpreendentemente mínimo.”

– Yiannis Philipopoulos, desenvolvedor de software sênior, Bandwidth 

Leia a postagem do blog >>

Saiba mais sobre o Amazon Polly

Acesse a página de recursos