Amazon Polly

Transforme texto em falas realistas usando o aprendizado profundo

O Amazon Polly é um serviço que transforma texto em falas realistas, permitindo que você crie aplicativos que falam e desenvolva categorias totalmente inéditas de produtos compatíveis com fala. O serviço de conversão de texto em fala (TTS) do Polly usa tecnologias avançadas de aprendizagem profunda para sintetizar falas que soam como a voz humana.

Com dezenas de vozes realistas em vários idiomas, você pode selecionar a voz ideal e criar aplicativos com recursos integrados de fala que funcionam em vários países diferentes. Além das vozes de TTS padrão, o Amazon Polly oferece vozes de conversão neural de texto em fala (NTTS), que oferecem melhorias avançadas na qualidade da fala por meio de uma nova abordagem de machine learning, proporcionando aos clientes uma das vozes de conversão de texto em fala mais naturais e humanas do mercado. Nossa tecnologia de TTS neural também oferece dois estilos de fala: um estilo de leitura de Noticiário, adaptado para casos de uso de narração de notícias, e um estilo de fala de Conversação, que pode ser usado para vários casos de uso, incluindo aplicativos de telefonia.

Ouça a voz de Noticiário do Amazon Polly » Ouça a voz de Conversação do Amazon Polly »
Intro to Amazon Polly (2min08s)
Idioma Feminino Masculino Amostra de texto
Inglês

Joanna (Padrão)

Joanna (Neural)

Matthew (Padrão) 

Matthew (Neural)

Hello. Do you speak a foreign language? One language is never enough.
Português do Brasil Vitória Ricardo Oi. Você fala algum idioma estrangeiro? Somente um idioma nunca é bastante.
Dinamarquês Naja Mads Hej. Taler du et fremmed sprog? Et sprog er aldrig nok.
Francês Léa Mathieu Bonjour. Parlez-vous une autre langue que le français? Une langue n'est jamais assez.
Japonês Mizuki
Takumi こんにちは、外国語を話せますか? 世界にはたくさんの言語があります。
Coreano Seoyeon   안녕하세요? 외국어를 구사하십니까? 이 세상에는 수많은 언어들이 있답니다.
Chinês (Mandarim) Zhiyu   你好,你会不会说其他外语?只会一种语言是不够的。
Espanhol Penélope Miguel Hola. ¿Hablas algún idioma extranjero? Un solo idioma no es suficiente.
Confira aqui a lista completa de vozes e idiomas para os quais o Amazon Polly oferece suporte.

Benefícios

Vozes com som natural

O Amazon Polly oferece dezenas de idiomas e uma ampla seleção de vozes masculinas e femininas com som natural. A pronúncia fluida de texto do Amazon Polly permite gerar saída de voz de alta qualidade para um público global.

Armazene e redistribua as falas

O Amazon Polly permite reproduções ilimitadas das falas geradas, sem taxas adicionais. Você pode criar arquivos de fala em formatos padrão, como MP3 e OGG, e enviá-los da nuvem ou localmente com aplicativos ou dispositivos para reprodução offline.

Streaming em tempo real

A entrega de vozes realistas e experiências de usuário conversacionais exige tempos de resposta consistentemente rápidos. Sempre que você envia um texto longo à API do Amazon Polly, o áudio é retornado ao aplicativo como um stream, o que permite reproduzir imediatamente as vozes. 

Personalize e controle a saída de falas

Modifique as vozes do Amazon Polly de acordo com as suas necessidades. O Amazon Polly oferece suporte a léxicos e tags SSML, que permite controlar aspectos da fala como pronúncia, volume, tom, velocidade, etc.  

 

 

Baixo custo

A definição de preço com pagamento conforme o uso, o baixo custo por caractere convertido e as reproduções ilimitadas do Amazon Polly fazem dele uma alternativa econômica para adicionar voz a aplicativos.

Casos de uso

Criação de conteúdo

O áudio pode ser usado como mídia complementar para comunicação escrita e/ou visual. A disponibilização do conteúdo em voz oferece ao público uma forma alternativa de consumir informações e atender às necessidades de um grande grupo de leitores. O Amazon Polly pode gerar falas em dezenas de idiomas, facilitando a adição de fala a aplicativos com público global, como feeds RSS, sites ou vídeos.

Exemplo: converter um artigo em fala e fazer seu download como MP3
Converter um artigo em fala e fazer seu download como MP3
GoAnimate

“O Amazon Polly oferece aos usuários do GoAnimate o recurso de dar imediatamente voz aos personagens animados em nossa plataforma. Isso é particularmente útil em cenários em que a narração ao vivo exige muitos recursos ou muito tempo, como no desenvolvimento de um vídeo em diversos idiomas ou na fase de pré-produção para acelerar o processo de aprovação. A fala é integrada diretamente ao nosso conjunto sofisticado de ativos pré-animados, o que reforça a facilidade de uso do GoAnimate e proporciona aos nossos clientes eficiência e velocidade de acesso ao mercado.”

– Alvin Hung, diretor executivo e fundador, GoAnimate

Consulte o estudo de caso >>

E-learning

O Amazon Polly permite que desenvolvedores disponibilizem suas aplicações com uma experiência visual otimizada, oferecendo recursos como animação facial sincronizada com a fala ou destaque de palavras em estilo de karaokê. O Amazon Polly torna fácil solicitar streams adicionais de metadados com informações sobre quando frases, palavras e sons específicos estão sendo pronunciados. Ao usar esses streams de metadados junto com streams de áudio de fala sintetizada, os clientes poderão animar avatares e destacar textos à medida que o texto for falado (lido ao vivo) em suas aplicações.

Exemplo: reproduzir falas e destacar texto falado
Reproduzir falas e destacar texto falado
Duolingo

“Não consigo pensar em muitos casos de uso em que a pronúncia precisa seja mais importante que no aprendizado de um novo idioma. Constatamos que as vozes do Amazon Polly, além de terem alta qualidade, são tão eficientes quanto a fala humana natural para ensinar um idioma.”

– Severin Hacker, diretor de tecnologia, Duolingo

Leia a postagem do blog >>

Telefonia

Com o Amazon Polly, as centrais de atendimento aos clientes podem interagir com os clientes com vozes que soam naturais. Você pode armazenar em cache e reproduzir a saída de fala do Amazon Polly para interagir com os chamadores por meio de sistemas de Interactive Voice Response (IVR – Resposta por voz interativa), como o Amazon Connect. Além disso, você pode usar a API do Amazon Polly para disponibilizar automaticamente informações em tempo real, como status de serviços, consultas de contas e faturamento, endereços e informações de contato.

Por exemplo: conversão de texto em fala para sistemas de telefonia
Conversão de texto em fala para sistemas de telefonia
Largura de banda

“A Bandwidth criou um aplicativo de TTS pequeno, confiável e rápido usando o Amazon Polly. Agora, estamos usando vozes de alta qualidade com baixo custo. O esforço de desenvolvimento necessário para criar esse novo serviço foi surpreendentemente mínimo.”

– Yiannis Philipopoulos, Sr. Desenvolvedor de software, largura de banda 

Leia a postagem do blog >>

Saiba mais sobre o Amazon Polly

Acesse a página de recursos