Essayer Amazon Polly

Créer un compte gratuitement
Vous pouvez également vous connecter à la console

L'offre gratuite Amazon Polly inclut 5 millions de caractères par mois pour les 12 premiers mois, à compter de la première demande de discours.

Voir les détails relatifs à l'offre gratuite d'AWS »


Q : Qu'est-ce qu'Amazon Polly ?

Amazon Polly est un service qui convertit le texte en un enregistrement audio réaliste. Amazon Polly permet d'intégrer une fonction de communication de première classe aux applications existantes et de créer de toutes nouvelles catégories de produits vocaux allant des applications mobiles aux voitures, en passant par différents appareils et appliances. Ce service comprend  voix réalistes et prend en charge  langues. Vous pouvez donc sélectionner la voix idéale et distribuer vos applications vocales dans plusieurs zones géographiques. Amazon Polly est simple d'utilisation : il suffit d'envoyer le texte que vous souhaitez convertir en enregistrement audio à l'API Amazon Polly pour que le service renvoie immédiatement le flux audio à votre application, afin que vous puissiez le lire directement ou le stocker dans un fichier audio au format standard, tel que le MP3. Amazon Polly prend en charge les balises SSML (Speech Synthesis Markup Language) comme prosody pour vous permettre d'ajuster le débit de parole, le ton ou le volume de la synthèse vocale. Amazon Polly est un service sécurisé qui offre tous ces avantages à grande échelle et à une faible latence. Vous pouvez mettre en cache et réécouter le discours généré par Amazon Polly sans frais supplémentaires. Amazon Polly vous permet de convertir gratuitement 5 millions de caractères par mois durant la première année, à compter de l'inscription. La tarification à l'utilisation, les faibles coûts par requête ainsi que l'absence de restrictions sur le stockage et la réutilisation des enregistrements audio font d'Amazon Polly un moyen économique d'adopter la synthèse vocale dans toutes vos applications.

Q : Pourquoi devrais-je utiliser Amazon Polly ?

Vous pouvez utiliser Amazon Polly pour soutenir votre application avec une sortie vocale de haute qualité. Ce service économique présente des temps de réponse très courts et est disponible pour pratiquement tous les cas d'utilisation, sans restrictions sur le stockage et la réutilisation de l'enregistrement vocal généré.

Q : Quelles sont les fonctionnalités disponibles ?

Vous pouvez contrôler différents aspects de la voix, tels que la prononciation, le volume, le ton, le débit de parole, etc. à l'aide du langage de balisage SSML normalisé. Vous pouvez détecter lorsqu'un mot ou une phrase spécifique d'un texte est dit à l'utilisateur grâce aux métadonnées incluses dans le flux audio. Cela permet au développeur de synchroniser le surlignage graphique et les animations, telles que le mouvement des lèvres de l'avatar, avec le discours synthétisé. Vous pouvez modifier la prononciation de certains mots, tels que les noms d'entreprises, les acronymes, les mots étrangers et les néologismes (par exemple, « P!nk », « ROTFL », « C'est la vie » lorsqu'ils sont prononcés par une voix non francophone) à l'aide de lexiques personnalisés.

Q : Qu'est-ce que les Speech Marks ?

Les Speech Marks sont conçus comme un complément au discours synthétisé généré à partir du texte saisi. En utilisant ces métadonnées en même temps que le flux audio du discours synthétisé, les clients peuvent offrir une expérience visuelle améliorée telle qu'une synchronisation labiale ou un surlignage similaire à celui des vidéos de karaoké.

Amazon Polly génère des Speech Marks grâce aux quatre éléments suivants :

1) la phrase, qui indique un élément de phrase du texte saisi qui doit être prononcé ;

2) le mot, qui indique un élément de mot dans le texte ;

3) le visème, qui décrit la forme des lèvres correspondant au son prononcé ;

4) le SSML, qui décrit un élément SSML utilisé dans le texte.

Les Speech Marks sont générés sous la forme d'un flux JSON. Plus précisément, il s'agit d'un ensemble d'objets JSON autonomes délimités par des retours à la ligne, contenant un à quatre de ces éléments et produits pendant l'utilisation de la méthode de synthèse vocale avec le paramètre speech-mark-types. Consultez le guide du développeur Amazon Polly pour plus d'informations.

Q : Quels sont les cas d'utilisation les plus courants pour ce service ?

Avec Amazon Polly, vous pouvez donner vie à vos applications en ajoutant des capacités de synthèse vocale réaliste. Par exemple, dans le cadre de l'apprentissage en ligne et de l'enseignement, vous pouvez concevoir des applications utilisant la capacité Text-to-Speech (TTS) d'Amazon Polly pour aider les personnes rencontrant des difficultés de lecture. Amazon Polly peut permettre aux aveugles et malvoyants de consulter des contenus numériques (eBooks, actualités, etc.). Le service peut également être utilisé dans les systèmes d'annonces des transports publics et les systèmes de contrôle industriels à des fins de diffusion d'informations et de messages d'avertissement en cas d'urgence. Un large éventail d'appareils, tels que des décodeurs, des montres intelligentes, des tablettes, des smartphones et des appareils de l'Internet des objets, peuvent se servir d'Amazon Polly pour fournir un enregistrement audio. Amazon Polly peut aussi être utilisé dans les solutions de téléphonie pour ajouter de la voix aux systèmes de serveur vocal interactif. Les applications telles que les jeux-questionnaires, les animations, les avatars ou la génération de narrations constituent des cas d'utilisation courants pour une solution TTS basée sur le cloud comme Amazon Polly.

Q : Comment ce produit fonctionne-t-il avec d'autres produits AWS ?

En utilisant également Amazon Lex, les développeurs peuvent créer de véritables interfaces utilisateur vocales pour leurs applications. Au sein d'Amazon Connect, la synthèse vocale d'Amazon Polly est utilisée pour créer des services de centre de contact basés sur le cloud et en libre-service. En outre, les développeurs d'applications mobiles et de solutions de l'Internet des objets peuvent utiliser Amazon Polly pour ajouter une sortie vocale à leurs propres systèmes.

Q : Quels sont les avantages d'une solution de synthèse vocale basée sur le cloud par rapport à une solution sur appareil ?

Les solutions de synthèse vocale sur appareil nécessitent que des ressources informatiques considérables, notamment une puissance CPU, de la RAM et de l'espace disque, soient disponibles sur l'appareil. Elles peuvent entraîner des coûts de développement plus élevés et une consommation d'énergie plus importante sur des appareils tels que des tablettes, des smartphones, etc. En revanche, la conversion d'un texte en voix effectuée dans le cloud permet de réduire considérablement les besoins en ressources locales. Toutes les langues et voix disponibles peuvent ainsi être prises en charge en qualité optimale. En outre, des améliorations au niveau de la voix sont instantanément disponibles pour tous les utilisateurs finaux et ne requièrent pas d'autres mises à jour au niveau des appareils. Les solutions de synthèse vocale basées sur le cloud sont indépendantes de la plateforme, ce qui permet de réduire les délais et efforts de développement.

Q : Comment démarrer avec Amazon Polly ?

Il vous suffit de vous connecter à votre compte AWS et d'accéder à la console Amazon Polly (qui fait partie de la console AWS). Vous pouvez ensuite utiliser la console pour saisir du texte et écouter l'enregistrement audio généré ou l'enregistrer sous forme de fichier audio.

Q : Dans quelles régions AWS ce service est-il disponible ?

Amazon Polly est accessible dans le monde entier à partir des 14 régions AWS suivantes : Asie-Pacifique (Mumbai), Asie-Pacifique (Séoul), Asie-Pacifique (Singapour), Asie-Pacifique (Sydney), Asie-Pacifique (Tokyo), Canada (Central), UE (Francfort), UE (Irlande), UE (Londres), Amérique du Sud (São Paulo), USA Est (Virginie), USA Est (Ohio), USA Ouest (nord de la Californie), USA Ouest (Oregon).

Q : Quels langages de programmation sont pris en charge ?

Amazon Polly prend en charge tous les langages de programmation figurant dans le kit SDK AWS (Java, Node.js, .NET, PHP, Python, Ruby, Go et C++) et dans le kit SDK AWS Mobile (iOS/Android). Le service prend également en charge une API HTTP afin que vous puissiez mettre en place votre propre couche d'accès.

Q : Quels formats audio sont pris en charge ?

Avec Amazon Polly, vous pouvez diffuser du contenu audio à vos utilisateurs quasiment en temps réel. Vous pouvez également faire votre choix parmi plusieurs taux d'échantillonnage afin d'optimiser la bande passante et la qualité audio pour votre application. Amazon Polly prend en charge les formats MP3 et Vorbis, ainsi que les formats de diffusion audio PCM bruts.

Q : Quelles langues sont prises en charge ?

Anglais, américain Néerlandais Coréen Espagnol, américain
Anglais, australien Français Polonais Suédois
Anglais, britannique Français, canadien
Portugais Turc
Anglais, indien Allemand Portugais, brésilien
Norvégien
Anglais, gallois Islandais Roumain  
Gallois Italien Russe
  
Danois Japonais Espagnol, castillan
 

Q : Les limites de service AWS s'appliquent-elles à Amazon Polly ?

Pour garantir la disponibilité des ressources AWS et réduire le risque de facturation pour les nouveaux clients, AWS gère des limites de service pour chaque compte. Lorsque vous utilisez Amazon Polly pour soutenir votre application avec une sortie vocale de haute qualité, des limites de service par défaut s'appliquent, notamment concernant la limitation, les opérations et l'utilisation du Speech Synthesis Markup Language (SSML). Pour en savoir plus, consultez la section Limits in Amazon Polly du manuel Amazon Polly Developer Guide. La combinaison d'Amazon Polly avec d'autres services AWS, tels qu'AWS Batch pour un traitement par lots efficace, peut vous aider à tirer le meilleur parti d'Amazon Polly dans le cadre de ces limites de service.


Q : Combien coûte le service Amazon Polly ?

Consultez la page relative à la tarification d'Amazon Polly pour obtenir des informations sur les tarifs actuellement en vigueur.

Q : Puis-je utiliser ce service pour générer des messages vocaux statiques qui seront lus à plusieurs reprises ?

Oui. Le service n'impose aucune limite pour cette opération et aucuns frais supplémentaires ne s'appliquent.

Q : Puis-je utiliser ce service pour générer du contenu qui sera utilisé dans des systèmes de notification publics (par exemple, dans une gare) ?

Oui. Le service n'impose aucune limite pour cette opération et aucuns frais supplémentaires ne s'appliquent.

Q : Si je fais une requête de synthétisation pour 1 000 caractères, puis que je demande les Speech Marks pour les mêmes 1 000 caractères, serai-je facturé pour 2 000 caractères ?

Oui. Vous serez facturé pour chaque requête de synthétisation ou de Speech Marks suivant le nombre de caractères que vous envoyez au service.

Q : Amazon Polly fait-il partie de l'offre gratuite d'AWS ?

Oui, dans le cadre du niveau d'offre gratuite d'AWS, vous pouvez commencer à utiliser Amazon Polly gratuitement. A compter de leur inscription, les nouveaux clients Amazon Polly peuvent synthétiser gratuitement jusqu'à 5 millions de caractères par mois pendant les 12 premiers mois.

Q : Les prix indiqués sont-ils toutes taxes comprises ?

Pour obtenir plus d'informations sur les taxes, consultez la page d'aide sur les taxes d'Amazon Web Services.


Q : Amazon Polly utilisera-t-il mon contenu pour améliorer son service ? Quelle est la politique de confidentialité appliquée pour Amazon Polly ?

Amazon Polly peut utiliser votre contenu afin d'améliorer la qualité de nos offres de services, ainsi que d'autres produits et services d'apprentissage automatique proposés par AWS et ses affiliés. Certaines utilisations de votre contenu sont décisives pour la suite du développement de la technologie sous-jacente et l'amélioration de l'expérience client Amazon Polly. Votre confiance, la confidentialité et la sécurité de votre contenu constituent nos priorités n° 1 et nous mettons en place des contrôles techniques et physiques responsables et sophistiqués, qui sont conçus pour empêcher tout accès non autorisé ou divulgation de votre contenu et garantir que nos utilisations respectent les engagements que nous avons pris envers vous. Consultez la FAQ sur la confidentialité des données chez AWS pour en savoir plus.