Pular para o conteúdo principal

Amazon Polly | Gerador de voz com IA

Implante vozes humanas de alta qualidade e som natural em dezenas de idiomas

O que é o Amazon Polly?

O Amazon Polly é um serviço totalmente gerenciado que gera voz sob demanda, convertendo qualquer texto em uma transmissão de áudio. Usando tecnologias de aprendizado profundo para converter artigos, páginas da Web, documentos PDF e outros tipos de conversão de texto em fala (TTS). O Polly fornece dezenas de vozes realistas em um amplo conjunto de idiomas para você criar aplicações ativadas por fala que envolvem e convertem. Atenda às diversas necessidades linguísticas, de acessibilidade e aprendizado dos usuários em todas as regiões e mercados. Redes neurais avançadas e mecanismos de voz generativos funcionam em segundo plano, sintetizando a fala para você. Integre a API do Amazon Polly às suas aplicações existentes para estar preparado para a voz rapidamente. 

  

Casos de uso

Adicione fala a aplicações com público global, como feeds RSS, sites ou vídeos. Prepare seus aplicativos móveis e de IoT para o futuro com voz.

Saiba mais sobre geração de fala.

Armazene e reproduza a saída de voz do Amazon Polly para alertar os autores de chamadas por meio de sistemas de resposta de voz interativos ou automatizados. Use os recursos de IA para gerar vozes que se conectem emocionalmente com seus clientes.

Saiba mais sobre mecanismos de voz

Crie dublagens para animações, jogos e outras mídias diretamente de seus scripts. Use SSML, uma linguagem de marcação padrão baseada em XML do W3C, para ajustar a escolha de palavras, a ênfase e a entonação de acordo com a cena. Ajuste automaticamente a duração da fala para facilitar a dublagem multilíngue.

Saiba mais sobre o SSML

Recursos

O Amazon Polly tem uma variedade de recursos, incluindo alguns listados abaixo

Vozes realistas

Ofereça experiências de conversação ao usuário em tempos de resposta consistentemente rápidos

Ao solicitar a saída do Amazon Polly, você pode escolher entre dezenas de vozes realistas em vários idiomas. Cada voz é criada usando falantes nativos, com variações de voz para voz, até dentro do mesmo idioma. A maioria dos idiomas inclui uma ou mais vozes masculinas e femininas, então você pode escolher a mais adequada para seu caso de uso.

A woman wearing a yellow jacket stands outside, smiling while using a pink smartphone near a metal railing and modern structure.

Saída personalizável

Personalize e controle a saída de fala conforme necessário

O Amazon Polly permite que você crie uma saída personalizada de conversão de texto em fala que atrai e prende a atenção do seu público. Use léxicos personalizados para modificar a pronúncia de acrônimos, nomes de empresas, terminologia interna ou qualquer outra palavra que você escolher. As tags Speech Synthesis Markup Languages (SSML) do Amazon Polly também permitem ajustar a ênfase, a entonação, a escolha de palavras e o estilo. Gere a saída de IA de voz que melhor se adapte à sua empresa.

Missing alt text value

Poder da IA generativa

Acesse recursos integrados de IA generativa por uma fração do custo

O Amazon Polly oferece suporte a vários mecanismos de voz que você pode escolher para converter texto em fala. O mecanismo implanta um transformador de bilhões de parâmetros para gerar vozes de forma incremental e transmissível. Esse gerador de voz de IA cria uma fala sintética que é assertiva, emocionalmente envolvente e altamente coloquial, semelhante a uma voz humana real.

People collaborating at a wooden table with laptops, smartphone, potted plant, and a lightbulb lamp, suggesting teamwork and brainstorming in a modern workspace.

Controle e segurança

Armazene e redistribua arquivos de fala nos formatos padrão de forma segura 

Armazene sua saída de conversão de texto em fala em arquivos de áudio padrão, como MP3 e OGG, para redistribuição, análise, arquivamento ou qualquer outro caso de uso, sem nenhum custo extra. Armazene seus arquivos em cache para uma recuperação mais rápida, se necessário. A segurança, a confiança e a privacidade do seu conteúdo são as maiores prioridades da AWS. O Amazon Polly não retém o conteúdo de seus textos enviados.

Missing alt text value

Perguntas frequentes

Sim. O Amazon Polly oferece serviços gratuitos de IA de conversão de texto em fala por um ano após a inscrição, até um limite mínimo de uso. O limite varia de 100 mil caracteres a 5 milhões de caracteres, dependendo do mecanismo de voz escolhido. Para obter mais detalhes, consulte os preços do Amazon Polly.
O Amazon Polly oferece mais de cem vozes masculinas e femininas em mais de quarenta idiomas e variantes linguísticas. A AWS está constantemente atualizando e aumentando nossos recursos de voz.
O Amazon Polly produz MP3, OGG e outros formatos de arquivo de áudio padrão com amostragem de 8.000 Hz, 16.000 Hz e 22.050 Hz.
A resposta é sim. Atualmente, a Alexa usa a tecnologia do Polly para potencializar a solução de geração de texto para fala. No entanto, as vozes da Alexa foram criadas exclusivamente para a Alexa e não estão disponíveis externamente.
Não. O Amazon Polly é um serviço de IA em nuvem totalmente gerenciado. Você se comunica com ele usando APIs em seu código. Você não pode baixar nem implantar o código-fonte do Amazon Polly em seu ambiente. No entanto, você pode usar o Amazon Polly gratuitamente (até um limite de uso predeterminado) por 12 meses a partir do início. Para obter mais detalhes, consulte os preços do Amazon Polly.