Amazon Polly – Gerador de voz com IA

Implante vozes humanas de alta qualidade e som natural em dezenas de idiomas

O que é o Amazon Polly?

O Amazon Polly é um serviço totalmente gerenciado que gera voz sob demanda, convertendo qualquer texto em uma transmissão de áudio. Usando tecnologias de aprendizado profundo para converter artigos, páginas da Web, documentos PDF e outros tipos de conversão de texto em fala (TTS). O Polly fornece dezenas de vozes realistas em um amplo conjunto de idiomas para você criar aplicativos ativados por fala que envolvem e convertem. Atenda às diversas necessidades linguísticas, de acessibilidade e aprendizado dos usuários em todas as regiões e mercados. Redes neurais poderosas e mecanismos de voz generativos funcionam em segundo plano, sintetizando a fala para você. Integre a API do Amazon Polly aos seus aplicativos existentes para estar preparado para a voz rapidamente. 

Casos de uso

Adicione fala a aplicações com público global como feeds RSS, sites ou vídeos.

Saiba mais sobre geração de fala

Armazene e reproduza a saída de voz do Amazon Polly para alertar os autores de chamadas por meio de sistemas de resposta de voz interativos ou automatizados.

Saiba mais sobre a conversão de texto em fala (TTS) neural

Use o SSML, uma linguagem de marcação baseada em XML padrão W3C para aplicações de síntese de fala para oferecer suporte a tags SSML comuns para formação de frases, ênfase e entonação.

Saiba mais sobre o SSML

Capacidades

O Amazon Polly tem uma variedade de recursos, incluindo alguns listados abaixo

Vozes realistas

Ofereça experiências de conversação ao usuário em tempos de resposta consistentemente rápidos

Ao solicitar a saída do Amazon Polly, você pode escolher entre dezenas de vozes realistas em vários idiomas. Cada voz é criada usando falantes nativos, com variações de voz para voz, até dentro do mesmo idioma. A maioria dos idiomas inclui uma ou mais vozes masculinas e femininas, então você pode escolher a mais adequada para seu caso de uso.

Mulher na ponte com um telefone usando jaqueta amarela

Saída personalizável

Personalize e controle a saída de fala conforme necessário

O Amazon Polly permite que você crie uma saída personalizada de conversão de texto em fala que atrai e prende a atenção do seu público. Use léxicos personalizados para modificar a pronúncia de acrônimos, nomes de empresas, terminologia interna ou qualquer outra palavra que você escolher. As tags Speech Synthesis Markup Languages (SSML) do Amazon Polly também permitem ajustar ênfase, entonação, escolha de palavras e estilo. Gere a saída de IA de voz que melhor se adapte à sua empresa.

Imagem de homens trabalhando em um escritório

Poder da IA generativa

Acesse recursos integrados de IA generativa a uma fração do custo

O Amazon Polly oferece suporte a vários mecanismos de voz que você pode escolher para converter texto em fala. O mecanismo implanta um transformador de bilhões de parâmetros para gerar vozes de forma incremental e transmissível. Esse gerador de voz de IA cria uma fala sintética que é assertiva, emocionalmente envolvente e altamente coloquial, semelhante a uma voz humana real.

Jovens empresários trabalhando juntos em um novo projeto

Controle e segurança

Armazene e redistribua arquivos de fala nos formatos padrão de forma segura 

Armazene sua saída de conversão de texto em fala em arquivos de áudio padrão, como MP3 e OGG, para redistribuição, análise, arquivamento ou qualquer outro caso de uso, sem nenhum custo extra. Armazene seus arquivos em cache para uma recuperação mais rápida, se necessário. A segurança, a confiança e a privacidade do seu conteúdo são as maiores prioridades da AWS. O Amazon Polly não retém o conteúdo de seus textos enviados.

Imagem das mãos de uma pessoa trabalhando em um PC

Perguntas frequentes

Sim. O Amazon Polly oferece serviços gratuitos de IA de conversão de texto em fala por um ano após a inscrição, até um limite mínimo de uso. O limite varia de 100 mil caracteres a 5 milhões de caracteres, dependendo do mecanismo de voz escolhido. Para mais detalhes, consulte a definição de preço do Amazon Polly.
O Amazon Polly oferece mais de 100 vozes masculinas e femininas em mais de 40 idiomas e variantes linguísticas. A AWS está constantemente atualizando e aumentando nossos recursos de voz.
O Amazon Polly produz MP3, OGG e outros formatos de arquivo de áudio padrão com amostragem de 8.000 Hz, 16.000 Hz e 22.050 Hz.
A resposta é sim. Atualmente, a Alexa usa a tecnologia do Polly para potencializar a solução de geração de texto para fala. No entanto, as vozes da Alexa foram criadas exclusivamente para a Alexa e não estão disponíveis externamente.
Não. O Amazon Polly é um serviço de IA em nuvem totalmente gerenciado. Você se comunica com ele usando APIs em seu código. Você não pode baixar nem implantar o código-fonte do Amazon Polly em seu ambiente. No entanto, você pode usar o Amazon Polly gratuitamente (até um limite de uso predeterminado) por 12 meses a partir do início. Para mais detalhes, consulte a definição de preço do Amazon Polly.

Veja mais sobre a AWS