Comece a usar o Amazon Polly

O Amazon Polly é um serviço que transforma texto em falas realistas, permitindo criar aplicativos que falam e definir categorias totalmente novas de produtos compatíveis com fala. O Amazon Polly é um serviço de conversão de texto em fala que usa tecnologias avançadas de aprendizado profundo para sintetizar falas que soam como a voz humana.

O Amazon Polly inclui dezenas de vozes realistas em vários idiomas, o que permite selecionar a voz ideal e criar aplicativos com recursos de fala que funcionam em vários países diferentes.

Idioma Feminino Masculino Amostra de texto
Inglês Joanna Matthew Hello. Do you speak a foreign language? One language is never enough.
Dinamarquês Naja Mads Hej. Taler du et fremmed sprog? Et sprog er aldrig nok.
Português do Brasil Vitória Ricardo Oi. Você fala algum idioma estrangeiro? Somente um idioma nunca é bastante.
Espanhol Penélope Miguel Hola. ¿Hablas algún idioma extranjero? Un solo idioma no es suficiente.
Japonês Mizuki
Takumi こんにちは、外国語を話せますか? 世界にはたくさんの言語があります。
Coreano Seoyeon   안녕하세요? 외국어를 구사하십니까? 이 세상에는 수많은 언어들이 있답니다。

Confira a lista completa de vozes e idiomas para os quais o Amazon Polly oferece suporte aqui.


Data

Título

Autor

9 de novembro de 2017 Modify the Timbre of Amazon Polly Voices with the New Vocal Tract SSML Feature Robin Dautricourt, gerente de produtos sênior, Amazon Polly

19 de outubro de 2017

Convert Your Text into an MP3 File with Amazon Polly and a Simple Python Script Dzidas Martinaitis, cientista de dados, AWS

12 de outubro de 2017

Amazon Polly Expands to the Asia Pacific (Tokyo) Region and Adds Two New Voices Robin Dautricourt, gerente de produtos sênior, Amazon Polly

29 de setembro de 2017

Using Amazon Polly to Provide Real-Time Home Monitoring Alerts Siva K. Syamala, desenvolvedor sênior, Y-Cam Solutions
30 de agosto de 2017 How Amazon Polly Breathed Life into Dan Brown’s Digital Assistant Damian Dutton, diretor executivo e fundador, Beeliked

Leia todas as publicações do blog de IA relacionadas ao Amazon Polly aqui.


Vozes com som natural

Vozes com som natural

O Amazon Polly disponibiliza dezenas de vozes realistas e aceita vários idiomas, inclusive uma grande variedade de vozes masculinas e femininas com diversos sotaques. A pronúncia fluida de texto em vários idiomas do Amazon Polly permite disponibilizar uma saída de voz de alta qualidade e criar aplicações para usuários globais.

Integração fácil

Integração fácil

O Amazon Polly facilita a adição de voz a um site, aplicativo móvel ou dispositivo. Com o Amazon Polly, basta escrever o texto que você quer converter em fala e enviá-lo à API do Amazon Polly. Depois disso, você receberá imediatamente o stream de áudio. Ao contrário de outras soluções que exigem um demorado processo de aprovação, não é necessário descrever como você usará as falas do Amazon Polly na sua aplicação nem assinar contratos de distribuição. Você pode começar a usar o serviço imediatamente.

Armazene e redistribua falas

Armazene e redistribua falas

Outras soluções exigem royalties ou cobram uma taxa a cada reprodução de um áudio gerado anteriormente. O Amazon Polly permite reproduções ilimitadas, sem taxas adicionais. Essas reproduções gratuitas também se aplicam ao uso off-line. Você pode criar arquivos de fala em diversos formatos padrão, como MP3 e OGG, e armazená-los em dispositivos como celulares ou dispositivos da Internet das Coisas (IoT) para reprodução off-line.

 

Baixo custo

Baixo custo

A definição de preço com pagamento conforme o uso, o baixo custo por caractere convertido e as reproduções ilimitadas fazem do Amazon Polly uma forma econômica de habilitar a síntese de falas em praticamente qualquer aplicação.

Resposta rápida

Resposta rápida

A entrega de vozes realistas e experiências de usuário conversacionais exige tempos de resposta consistentemente rápidos. As aplicações com uso de voz precisam reproduzir falas sintetizadas sem demora. Considere aplicações que fornecem orientações de navegação faladas, aplicações de eLearning que instruem alunos verbalmente e aplicações que envolvem os usuários por meio de diálogos em tempo real. Essas aplicações serão mais eficazes se as respostas iniciarem sem demoras percebidas no fluxo da conversação. Sempre que você envia um texto longo à API do Amazon Polly, o áudio é retornado à aplicação como um stream, o que permite reproduzir imediatamente as vozes. Esses tipos de respostas dinâmicas e faladas exigem acesso a uma quantidade de áudio de fala muito maior que a normalmente disponível para armazenamento nos dispositivos dos usuários. O Amazon Polly reside na nuvem, o que permite acessar uma grande variedade de falas sintetizadas. O Amazon Polly permite que a aplicação dê respostas ainda mais relevantes com a inclusão de dados em tempo real.

O Amazon Polly facilita a adição de fala a vídeos, apresentações ou cursos de treinamento on-line. O Amazon Polly pode gerar falas em 24 idiomas, o que facilita a adição de voz a aplicações com um público global. Com o Amazon Polly, você pode ler feeds de RSS, notícias ou e-mail e armazenar as falas sintetizadas na forma de arquivos de áudio.

Criação de conteúdo
GoAnimate

"O Amazon Polly oferece aos usuários do GoAnimate o recurso de dar imediatamente voz aos personagens animados em nossa plataforma. Isso é particularmente útil em cenários em que a narração ao vivo exige muitos recursos ou muito tempo, como no desenvolvimento de um vídeo em diversos idiomas ou na fase de pré-produção para acelerar o processo de aprovação. A fala é integrada diretamente ao nosso conjunto sofisticado de ativos pré-animados, o que reforça a facilidade de uso do GoAnimate e proporciona aos nossos clientes eficiência e velocidade de acesso ao mercado."

– Alvin Hung, diretor executivo e fundador, GoAnimate


O Amazon Polly permite que desenvolvedores disponibilizem suas aplicações com uma experiência visual otimizada, oferecendo recursos como animação facial sincronizada com a fala ou destaque de palavras em estilo de karaokê. O Amazon Polly torna fácil solicitar streams adicionais de metadados com informações sobre quando frases, palavras e sons específicos estão sendo pronunciados. Ao usar esses streams de metadados junto com streams de áudio de fala sintetizada, os clientes poderão animar avatares e destacar textos à medida que o texto for falado (lido ao vivo) em suas aplicações.

Criação de conteúdo

"Tentamos tornar as salas de aula baseadas na nuvem mais atraentes e eficazes a todos, inclusive para usuários com dificuldades de leitura e escrita. O Amazon Polly otimiza a nossa plataforma de aprendizado, integrando vozes de alta qualidade para conversão de texto em fala ao nosso pacote de produtos do AppWriter. É essencial que os nossos usuários possam ver o destaque em tempo real do texto enquanto ele estiver sendo lido em voz alta. Com o recurso de aspas (marcações de fala) do Polly, o AppWriter pode proporcionar uma experiência de leitura otimizada que oferece as condições certas para qualquer pessoa que esteja tendo dificuldades de leitura e escrita."

– Stefan Pal, Diretor de operações, Wizkids


Com o Amazon Polly, as centrais de atendimento aos clientes podem responder com vozes que soam naturais. Você pode reproduzir as saídas de fala do Amazon Polly em sistemas de IVR (Interactive voice response – Resposta de voz interativa). Além disso, você pode usar a API do Amazon Polly para disponibilizar automaticamente informações em tempo real, como status de serviços, consultas de contas e faturamento, endereços e informações de contato.

Central de atendimento de clientes

“A Bandwidth criou um aplicativo de TTS pequeno, confiável e rápido usando o Amazon Polly. Agora, estamos usando vozes de alta qualidade com baixo custo. O esforço de desenvolvimento necessário para criar esse novo serviço foi surpreendentemente mínimo.”

– Yiannis Philipopoulos, desenvolvedor de software sênior, Bandwidth


O Amazon Polly viabiliza novos casos de uso da Internet das Coisas (IoT), permitindo adicionar fala a dispositivos IoT com facilidade e baixo custo. Os dispositivos da IoT podem usar a fala para fornecer respostas e notificações naturais, o que torna as aplicações mais acessíveis e permite que os usuários consumam informações sem depender de uma tela. Com o Amazon Polly, você pode gerar arquivos de fala e armazená-los em dispositivos para reprodução offline.

Use o AWS Lambda para gerar URLs pré-assinados do Polly com base em eventos do mecanismo de regras da AWS IoT e use o Device Gateway para enviar esses URLs a dispositivos da IoT para que possam solicitar falas realistas.

Internet das Coisas (IoT)

“Nossa pesquisa sugere que os clientes atuais estão menos propensos a comprar uma solução de segurança inteligente com recursos de voz se a voz tiver um som robótico, como acontece com vários outros serviços de concorrentes da AWS. Nossos clientes adoram o som humano da voz do Amazon Polly. Na verdade, muitos pensam que é uma pessoa real.”

– Devin Chawda, diretor executivo, Y-Cam Solutions 


O Amazon Polly pode ser usado para aprimorar a usabilidade de aplicações que ensinam pessoas a falar novos idiomas. Por exemplo, os usuários finais podem digitar frases em um idioma estrangeiro no aplicativo para ouvi-las faladas por um falante nativo. O Amazon Polly oferece 24 idiomas, o que proporciona aos professores e alunos um grande número de opções.

Aprendizado de idiomas
Duolingo

"Não consigo pensar em muitos casos de uso em que a pronúncia precisa seja mais importante que no aprendizado de um novo idioma. Constatamos que as vozes do Amazon Polly, além de terem alta qualidade, são tão eficientes quanto a fala humana natural para ensinar um idioma."

– Severin Hacker, diretor de tecnologia, Duolingo


Com o Amazon Polly, você pode criar e distribuir informações acessíveis na forma de falas sintetizadas para pessoas com deficiências visuais. Dessa forma, você pode ajudar pessoas com perdas visuais a consumir vários conteúdos, como notícias livros ou mensagens de e-mail.

Royal National Institute of Blind People

"No momento, usamos a tecnologia de conversão de texto em fala da Amazon para criar e distribuir informações acessíveis na forma de conteúdo de áudio sintetizado para nossa grande base de clientes B2B e B2C, incluindo concessionárias de serviços públicos, instituições financeiras e empresas de mídia, bem como outros materiais voltados ao cliente, como revistas e publicações. O anúncio do Amazon Polly nos entusiasmou com a capacidade de oferecer uma experiência ainda melhor a esses clientes, entregando vozes incrivelmente realistas que cativarão e envolverão o nosso público."

– John Worsfold, gerente de implementação de soluções, Royal National Institute of Blind People

É fácil começar a usar o Amazon Polly. Faça login no console para começar a gerar falas com seu próprio texto em apenas alguns cliques.

Comece a usar