Amazon Polly

Transforme texto em falas realistas usando o aprendizado profundo

O Amazon Polly é um serviço que transforma texto em falas realistas, permitindo que você crie aplicativos que falam e desenvolva categorias totalmente inéditas de produtos compatíveis com fala. O Amazon Polly é um serviço de conversão de texto em fala que usa tecnologias avançadas de aprendizado profundo para sintetizar falas que soam como a voz humana.

Com dezenas de vozes realistas em vários idiomas, você pode selecionar a voz ideal e criar aplicativos com recursos integrados de fala que funcionam em vários países diferentes.

Ouça o Amazon Polly >>
Introdução ao Amazon Polly
Idioma Feminino Masculino Amostra de texto
Inglês Joanna Matthew Hello. Do you speak a foreign language? One language is never enough.
Português do Brasil Vitória Ricardo Oi. Você fala algum idioma estrangeiro? Somente um idioma nunca é bastante.
Dinamarquês Naja Mads Hej. Taler du et fremmed sprog? Et sprog er aldrig nok.
Francês Léa Mathieu Bonjour. Parlez-vous une autre langue que le français? Une langue n'est jamais assez.
Japonês Mizuki
Takumi こんにちは、外国語を話せますか? 世界にはたくさんの言語があります。
Coreano Seoyeon   안녕하세요? 외국어를 구사하십니까? 이 세상에는 수많은 언어들이 있답니다.
Chinês (Mandarim) Zhiyu   你好,你会不会说其他外语?只会一种语言是不够的。
Espanhol Penélope Miguel Hola. ¿Hablas algún idioma extranjero? Un solo idioma no es suficiente.
Confira aqui a lista completa de vozes e idiomas para os quais o Amazon Polly oferece suporte.

Benefícios

Vozes com som natural

O Amazon Polly oferece dezenas de idiomas e uma ampla seleção de vozes masculinas e femininas com som natural. A pronúncia fluida de texto do Amazon Polly permite gerar saída de voz de alta qualidade para um público global.

Armazene e redistribua as falas

O Amazon Polly permite reproduções ilimitadas das falas geradas, sem taxas adicionais. Você pode criar arquivos de fala em formatos padrão, como MP3 e OGG, e enviá-los da nuvem ou localmente com aplicativos ou dispositivos para reprodução offline.

Streaming em tempo real

A entrega de vozes realistas e experiências de usuário conversacionais exige tempos de resposta consistentemente rápidos. Sempre que você envia um texto longo à API do Amazon Polly, o áudio é retornado ao aplicativo como um stream, o que permite reproduzir imediatamente as vozes. 

Personalize e controle a saída de falas

Modifique as vozes do Amazon Polly de acordo com as suas necessidades. O Amazon Polly oferece suporte a léxicos e tags SSML, que permite controlar aspectos da fala como pronúncia, volume, tom, velocidade, etc.  

 

 

Baixo custo

A definição de preço com pagamento conforme o uso, o baixo custo por caractere convertido e as reproduções ilimitadas do Amazon Polly fazem dele uma alternativa econômica para adicionar voz a aplicativos.

Casos de uso

Criação de conteúdo

O áudio pode ser usado como mídia complementar para comunicação escrita e/ou visual. A disponibilização do conteúdo em voz oferece ao público uma forma alternativa de consumir informações e atender às necessidades de um grande grupo de leitores. O Amazon Polly pode gerar falas em dezenas de idiomas, facilitando a adição de fala a aplicativos com público global, como feeds RSS, sites ou vídeos.

Exemplo: converter um artigo em fala e fazer seu download como MP3
Polly-1-Content_Creation@2x
Goanimate

“O Amazon Polly oferece aos usuários do GoAnimate o recurso de dar imediatamente voz aos personagens animados em nossa plataforma. Isso é particularmente útil em cenários em que a narração ao vivo exige muitos recursos ou muito tempo, como no desenvolvimento de um vídeo em diversos idiomas ou na fase de pré-produção para acelerar o processo de aprovação. A fala é integrada diretamente ao nosso conjunto sofisticado de ativos pré-animados, o que reforça a facilidade de uso do GoAnimate e proporciona aos nossos clientes eficiência e velocidade de acesso ao mercado.”

– Alvin Hung, diretor executivo e fundador, GoAnimate

Consulte o estudo de caso >>

E-learning

O Amazon Polly permite que desenvolvedores disponibilizem suas aplicações com uma experiência visual otimizada, oferecendo recursos como animação facial sincronizada com a fala ou destaque de palavras em estilo de karaokê. O Amazon Polly torna fácil solicitar streams adicionais de metadados com informações sobre quando frases, palavras e sons específicos estão sendo pronunciados. Ao usar esses streams de metadados junto com streams de áudio de fala sintetizada, os clientes poderão animar avatares e destacar textos à medida que o texto for falado (lido ao vivo) em suas aplicações.

Exemplo: reproduzir falas e destacar texto falado
Polly-4-Language-Learning@2x
Duolingo

“Não consigo pensar em muitos casos de uso em que a pronúncia precisa seja mais importante que no aprendizado de um novo idioma. Constatamos que as vozes do Amazon Polly, além de terem alta qualidade, são tão eficientes quanto a fala humana natural para ensinar um idioma.”

– Severin Hacker, diretor de tecnologia, Duolingo

Leia a postagem do blog >>

Telefonia

Com o Amazon Polly, as centrais de atendimento aos clientes podem interagir com os clientes com vozes que soam naturais. Você pode armazenar em cache e reproduzir a saída de fala do Amazon Polly para interagir com os chamadores por meio de sistemas de Interactive Voice Response (IVR – Resposta por voz interativa), como o Amazon Connect. Além disso, você pode usar a API do Amazon Polly para disponibilizar automaticamente informações em tempo real, como status de serviços, consultas de contas e faturamento, endereços e informações de contato.

Por exemplo: conversão de texto em fala para sistemas de telefonia
Polly-2-Customer_Contact_Center@2x
bandwidth-hdr-logo

“A Bandwidth criou um aplicativo de TTS pequeno, confiável e rápido usando o Amazon Polly. Agora, estamos usando vozes de alta qualidade com baixo custo. O esforço de desenvolvimento necessário para criar esse novo serviço foi surpreendentemente mínimo.”

– Yiannis Philipopoulos, Sr. Desenvolvedor de software, largura de banda 

Leia a postagem do blog >>

Saiba mais sobre o Amazon Polly

Acesse a página de recursos