Geral

P: O que é o Amazon Polly?

O Amazon Polly é um serviço que transforma texto em falas realistas. O Amazon Polly permite que aplicações atuais usem um recurso de fala de alto nível e cria oportunidades para categorias totalmente novas de produtos com fala, que abrangem de aplicações móveis e veículos a dispositivos e eletrodomésticos. O Amazon Polly inclui dezenas de vozes realistas e aceita vários idiomas, o que permite selecionar a voz ideal e distribuir aplicações com recursos de fala em várias regiões diferentes. O Amazon Polly é fácil de usar. Basta enviar o texto a ser convertido em fala à API do Amazon Polly. A aplicação receberá imediatamente o stream de áudio do Amazon Polly para reprodução direta ou armazenamento em formato de arquivo de áudio padrão, como MP3. O Amazon Polly permite tags de Speech Synthesis Markup Language (SSML), como prosódia, o que permite ajustar a velocidade, o tom e o volume das falas. O Amazon Polly é um serviço seguro que oferece todos esses benefícios em grande escala e com baixa latência. É possível armazenar em cache e reproduzir a fala gerada pelo Amazon Polly sem custos adicionais. Após o cadastro, o Amazon Polly permite converter gratuitamente 5 milhões de caracteres ao mês durante o primeiro ano. A definição de preço com pagamento conforme o uso, o baixo custo por solicitação e a inexistência de restrições de armazenamento e reutilização da saída de fala do Amazon Polly fazem dele uma forma econômica de utilizar síntese de fala em qualquer lugar.

P: Por que devo usar o Amazon Polly?

Você pode usar o Amazon Polly para usar saídas de fala de alta qualidade em aplicações. Esse serviço econômico oferece tempos de resposta muito baixos e está disponível para praticamente qualquer caso de uso, sem restrições de armazenamento e reutilização das falas geradas.

P: Quais recursos estão disponíveis?

Você pode controlar vários aspectos da fala como pronúncia, volume, tom e velocidade, entre outros, usando Speech Synthesis Markup Language (SSML) padrão. Você pode detectar quando palavras ou frases específicas no texto estão sendo faladas para o usuário com base nos metadados inclusos no stream de áudio. Isso permite que o desenvolvedor sincronize destaque gráfico e animações, como os movimentos de lábios de um avatar, com a fala sintetizada. É possível modificar a pronúncia de palavras específicas como nomes de empresa, abreviações, palavras estrangeiras e neologismos como, "P!nk", "ROTFL", "C’est la vie" (quando falado por uma voz não francesa) usando léxicos personalizados.

P: O que são as marcas de fala?

As marcas de fala foram criadas para complementar a fala sintetizada gerada por meio do texto de entrada. Ao usar esses metadados junto com o stream de áudio de fala sintetizada, os clientes poderão disponibilizar às suas aplicações uma experiência visual otimizada, oferecendo recursos como animação sincronizada com a fala ou destaque em estilo de karaokê.

O Amazon Polly gera marcas de fala usando os quatro seguintes elementos:

  1. Frase, que indica um elemento de frase no texto de entrada a ser falado;
  2. Palavra, que indica um elemento de palavra no texto;
  3. Visema, que descreve o formato dos lábios que corresponde ao som falado;
  4. SSML, que descreve um elemento SSML usado no texto.

As marcas de fala são fornecidas no formato de um fluxo JSON (especificamente, um conjunto de objetos JSON autônomos delimitados por novas linhas) que contém de um a todos esses quatro elementos quando o método synthesize-speech é usado com o parâmetro speech-mark-types. Você pode encontrar mais informações no Guia do desenvolvedor do Amazon Polly.

P: Quais são os casos de uso mais comuns para esse serviço?

O Amazon Polly permite que você dê vida às aplicações adicionando recursos de fala realistas. Por exemplo, você pode criar aplicações para e-learning e educação usando o recurso de conversão de texto em fala (TTS) do Amazon Polly para ajudar as pessoas com deficiências de leitura. O Amazon Polly pode ser usado para ajudar pessoas com deficiências visuais a consumir conteúdo digital (eBooks, notícias, etc.). Também é possível usar o Amazon Polly em sistemas de alto-falantes para anunciar notificações e emergências em sistemas de transporte público e controle industrial. Existe uma grande variedade de dispositivos como decodificadores, smartwatches, tablets, smartphones e dispositivos de IoT que pode utilizar o Amazon Polly para oferecer saída de áudio. O Amazon Polly pode ser usado em soluções de telefonia como voz para sistemas de resposta de voz interativa (IVR). Aplicações como quebra-cabeças, animações, avatars ou geração de narrativas são casos de uso comuns para soluções de TTS com base em nuvem como o Amazon Polly.

P: Como esse produto funciona com outros produtos da AWS?

A combinação com o Amazon Lex permite que os desenvolvedores criem interfaces completas de usuário com voz para suas aplicações. No Amazon Connect, a fala do Amazon Polly é usada para criar serviços de central de contatos, de autoatendimento e baseados na nuvem. Além disso, os desenvolvedores de aplicativos móveis e da Internet das Coisas (IoT) podem usar o Amazon Polly para adicionar saída falada a seus próprios sistemas.

P: Quais são as vantagens de uma solução de conversão de texto em fala com base na nuvem em relação a soluções de dispositivos?

As soluções de conversão de texto em fala em dispositivos exigem recursos de computação consideráveis, principalmente capacidade de CPU, RAM e espaço em disco para serem disponibilizadas nos dispositivos. Isso pode resultar em maior custo de desenvolvimento e consumo de energia em dispositivos como tablets, smartphones, etc. Por outro lado, a conversão de texto em fala na nuvem reduz drasticamente os requisitos de recursos locais. Com isso, é possível usar todas as linguagens e vozes disponíveis com a maior qualidade possível. Além disso, as correções e aprimoramentos das falas são disponibilizados instantaneamente a todos os usuários finais, sem necessidade de atualizações adicionais em todos os dispositivos. A conversão de texto em fala (TTS) na nuvem independe de plataforma, minimizando o tempo e os esforços de desenvolvimento.

P: Como faço para começar a usar o Amazon Polly?

Basta fazer login na sua conta da AWS e navegar até o console do Amazon Polly (que é parte do console da AWS). No console, você pode digitar qualquer texto e ouvir a fala gerada ou salvá-la como um arquivo de áudio.

P: Quais são as linguagens de programação compatíveis?

O Amazon Polly é compatível com todas as linguagens de programação incluídas no AWS SDK (Java, Node.js, .NET, PHP, Python, Ruby, Go e C++) e no AWS Mobile SDK (iOS/Android). Além disso, o Amazon Polly também aceita a API do HTTP, permitindo que você implemente sua própria camada de acesso.

P: Quais são os formatos de áudio compatíveis?

O Amazon Polly permite fazer streaming de áudio para os usuários em tempo quase real. Além disso, você pode escolher entre diversas taxas de amostragem para otimizar a largura de banda e a qualidade de áudio da aplicação. O Amazon Polly é compatível com os formatos de streaming de áudio MP3, Vorbis e PCM bruto.

P: Quais linguagens são compatíveis?

Consulte a documentação para obter a lista completa de linguagens compatíveis com o Amazon Polly.

P: O Amazon Polly tem Service Limits da AWS?

Para ajudar a garantir a disponibilidade de recursos da AWS e minimizar o risco de faturamento para novos clientes, a AWS mantém Service Limits para cada conta. Ao usar o Amazon Polly para capacitar sua aplicação com saída de fala de alta qualidade, existirão Service Limits padrão, como limitações de controle de fluxo, operações e uso de SSML. Para obter detalhes, consulte Limits in Amazon Polly no Guia do desenvolvedor do Amazon Polly. A combinação do Amazon Polly com outros serviços da AWS, como o AWS Batch para o processamento de lotes eficiente, pode ajudar a aproveitar o Amazon Polly ao máximo dentro dos Service Limits mencionados.

Faturamento

P: Qual é o custo do Amazon Polly?

Consulte a página de definição de preço do Amazon Polly para obter informações de definição de preço atualizadas.

P: Posso usar o serviço para gerar frases estáticas que serão reproduzidas várias vezes?

Sim, você pode. O serviço permite esse uso sem custos adicionais.

P: Posso usar o serviço para gerar conteúdo para sistemas de notificação em massa (por exemplo, em uma estação de trem)?

Sim, você pode. O serviço permite esse uso sem custos adicionais.

P: Se eu solicitar que 1.000 caracteres sejam sintetizados e solicitar marcas de fala com os mesmos 1.000 caracteres, serei cobrado por 2.000 caracteres?

Sim. Você será cobrado por cada solicitação de fala ou marcas de fala com base no número de caracteres enviados para o serviço.

P: O Amazon Polly participa do nível gratuito da AWS?

Como parte do nível de uso gratuito da AWS, você pode começar a utilizar o Amazon Polly gratuitamente. Após a inscrição, os novos clientes do Amazon Polly poderão sintetizar até 5 milhões de caracteres gratuitamente por mês durante os primeiros 12 meses.

P: Os preços incluem impostos?

Para obter detalhes fiscais, consulte a ajuda sobre impostos da Amazon Web Services.

Privacidade de dados

P: As entradas de texto processadas pelo Amazon Polly são armazenadas? Como são usadas pela AWS?

O Amazon Polly pode armazenar e usar entradas de texto processadas pelo serviço exclusivamente para oferecer e manter o serviço, bem como para melhorar e desenvolver a qualidade do Amazon Polly e de outras tecnologias de inteligência artificial/aprendizado de máquina da Amazon. O uso do seu conteúdo é necessário para a melhoria contínua da experiência do cliente do Amazon Polly, incluindo o desenvolvimento e o treinamento de tecnologias relacionadas. Não usamos nenhuma informação de identificação pessoal contida no conteúdo para direcionar produtos, serviços ou marketing para você ou para seus usuários finais. A sua confiança, a sua privacidade e a segurança do seu conteúdo são a nossa maior prioridade. Para isso, implementamos controles técnicos e físicos adequados e sofisticados, incluindo a criptografia de dados ociosos e em trânsito, projetados para evitar acesso ou divulgação de conteúdo sem a sua autorização e garantir que o nosso uso seja compatível com os compromissos que assumimos com você. Consulte https://aws.amazon.com/compliance/data-privacy-faq/ para obter mais informações.

P: Quem tem acesso ao meu conteúdo processado e armazenado pelo Amazon Polly?

Somente funcionários autorizados terão acesso ao seu conteúdo processado pelo Amazon Polly. A sua confiança, a sua privacidade e a segurança do seu conteúdo são a nossa maior prioridade. Para isso, implementamos controles técnicos e físicos adequados e sofisticados, incluindo a criptografia de dados ociosos e em trânsito, projetados para evitar acesso ou divulgação de conteúdo sem a sua autorização e garantir que o nosso uso seja compatível com os compromissos que assumimos com você. Consulte https://aws.amazon.com/compliance/data-privacy-faq/ para obter mais informações.

P: O meu conteúdo processado e armazenado pelo Amazon Polly continua sendo de minha propriedade?

Você sempre mantém a propriedade do conteúdo. Somente usaremos o seu conteúdo com o seu consentimento.

P: O conteúdo processado pelo Amazon Polly é movido para fora da região da AWS onde estou usando o Amazon Polly?

Todo o conteúdo processado pelo Amazon Polly é criptografado e armazenado quando ocioso na região da AWS onde você usa o Amazon Polly. Parte do conteúdo processado pelo Amazon Polly pode ser armazenado em outra região da AWS exclusivamente para fins de melhoria e desenvolvimento contínuos da sua experiência de cliente do Amazon Polly e de outras tecnologias de aprendizado de máquina/inteligência artificial da Amazon. A sua confiança, a sua privacidade e a segurança do seu conteúdo são a nossa maior prioridade. Para isso, implementamos controles técnicos e físicos adequados e sofisticados, incluindo a criptografia de dados ociosos e em trânsito, projetados para evitar acesso ou divulgação de conteúdo sem a sua autorização e garantir que o nosso uso seja compatível com os compromissos que assumimos com você. Consulte https://aws.amazon.com/compliance/data-privacy-faq/ para obter mais informações.

P: Posso usar o Amazon Polly em sites, programas ou outros aplicativos criados ou direcionados para crianças menores de 13 anos de idade e sujeitos à Children’s Online Privacy Protection Act (COPPA – Lei de proteção da privacidade infantil online)?

Sim. Sujeito à sua conformidade com os termos de serviço do Amazon Polly, que incluem a sua obrigação de disponibilizar qualquer notificação exigida e obter todos os consentimentos parentais verificáveis exigidos pela COPPA, você poderá usar o Amazon Polly em sites, programas ou outros aplicativos criados ou direcionados, no todo ou em parte, para crianças menores de 13 anos de idade.

Mostrar menos

P: Como posso determinar se um site, programa ou aplicativo está sujeito à COPPA?

Para obter informações sobre as exigências da COPPA e as diretrizes para determinar se o seu website, o seu programa ou outra aplicação está de acordo com a COPPA, consulte diretamente os recursos disponibilizados e mantidos pela United States Federal Trade Commission (Comissão da Federação Americana de Comércio). Esse website também contém informações sobre de como determinar se um serviço é direcionado ou criado, de modo integral ou parcial, para crianças menores de 13 anos.

Saiba mais sobre a definição de preço do Amazon Polly

Acesse a página de definição de preço
Pronto para começar?
Cadastrar-se
Mais dúvidas?
Entre em contato conosco