Démarrage avec Amazon Polly

Amazon Polly est un service qui transforme le texte en paroles réalistes, vous permettant de créer des applications qui parlent et de bâtir une toute nouvelle gamme de produits dotés de parole. Amazon Polly est un service de synthèse vocale qui exploite des technologies avancées d'apprentissage profond pour synthétiser la parole de façon naturelle.

Avec des douzaines de voix réalistes dans différentes langues, vous pouvez sélectionner la voix idéale et créer des applications vocales qui fonctionnent dans de nombreux pays différents.

Langue Femme Homme Modèle de texte
Anglais Joanna Joey Hello. Do you speak a foreign language? One language is never enough.
Danois Naja Mads Hej. Taler du et fremmed sprog? Et sprog er aldrig nok.
Brésilien Vitória Ricardo Oi. Você fala algum idioma estrangeiro? Somente um idioma nunca é bastante.
Espagnol Penélope Miguel Hola. ¿Hablas algún idioma extranjero? Un solo idioma no es suficiente.
Islandais Dóra Karl Halló, Hæ talar þú erlent tungumál? Eitt tungumál er aldrei nóg.

Consultez la liste complète des voix Amazon Polly et des langues prises en charge ici.


Date

Titre

Auteur

19 juillet 2017

Bâtir un service de synthèse vocable fiable avec Amazon Polly

Yiannis Philipopoulos, un développeur logiciel chez Bandwidth

30 juin 2017

Utiliser Amazon Polly pour offrir des soins de santé aux personnes atteintes de conditions chroniques

Michael Wray, architecte logiciel sénior chez Inhealthcare

26 mai 2017

Personalizing Videos: BeeLiked uses Amazon Polly to Launch the #DanBrownOrigin campaign, the World’s First Virtual Book Signing

Robin Dautricourt, chef de produit AWS, Amazon Polly

12 mai 2017

Powering Language Learning on Duolingo with Amazon Polly

André Kenji Horie, ingénieur logiciel, Duolingo

5 mai 2017

Create Audiobooks with Amazon Polly and AWS Batch

Matthew McClean, architecture de solutions de partenaire AWS

Lire tous les billets de blog IA sur Amazon Polly ici.


Des voix naturelles

Des voix naturelles

Amazon Polly offre  des douzaines de voix réalistes et prend en charge de nombreuses langues, y compris un large éventail de voix masculines et féminines avec une variété d'accents. La prononciation fluide d'Amazon Polly dans plusieurs langues vous permet d'offrir des sorties vocales de grande qualité et de créer des applications pour les utilisateurs du monde entier.

Une intégration facile

Une intégration facile

Amazon Polly permet d'ajouter facilement de la voix à votre site Web, à votre application mobile ou à votre appareil. Avec Amazon Polly, il suffit d'écrire le texte que vous voulez convertir en discours sur l'API d'Amazon Polly, qui renvoie immédiatement le flux audio. Contrairement à d'autres solutions qui nécessitent un long processus d'approbation, Amazon Polly ne vous demande pas de décrire comment vous utiliserez son discours dans votre application, et il n'y a pas de contrats de distribution à signer : vous pouvez donc commencer tout de suite.

Enregistrer et redistribuer la parole

Enregistrer et redistribuer la parole

Contrairement à d'autres solutions qui nécessitent une redevance ou des frais chaque fois que vous réutilisez le fichier audio généré précédemment, Amazon Polly permet de le rejouer de manière illimitée sans frais supplémentaires. Ces rediffusions gratuites s'appliquent également au mode hors connexion. Vous pouvez créer des fichiers vocaux dans divers formats standard, tels que MP3 et OGG, et les stocker sur des périphériques tels que des téléphones mobiles ou des périphériques Internet des Objets (IoT) pour la lecture hors ligne.

 

Coût réduit

Coût réduit

La tarification à la carte, le faible coût par caractère converti et les rediffusions illimitées d'Amazon Polly en font un moyen rentable d'adopter la synthèse vocale dans absolument n'importe quelle application.

Réponse rapide

Réponse rapide

Offrir des voix réalistes et des expériences utilisateur conversationnelles requiert des temps de réponse constamment rapides. Les applications vocales ont besoin de lire la parole synthétisée sans temps de latence. Prenez par exemple les applications qui fournissent des instructions vocales pour la navigation, les applications d'apprentissage en ligne qui fournissent des instructions orales aux étudiants et les applications qui interagissent avec l'utilisateur par le dialogue en temps réel. Ces applications sont plus efficaces lorsque les réponses peuvent commencer sans que des retards soient perçus dans le flux de la conversation. Même lorsque vous envoyez un long texte à l'API d'Amazon Polly, il renvoie l'audio à votre application en tant que flux afin que vous puissiez lire les voix immédiatement. Ces types de réponses orales dynamiques nécessitent l'accès à une quantité de discours oral beaucoup plus importante que ce qui est généralement disponible pour le stockage sur les appareils des utilisateurs. Amazon Polly est hébergé dans le cloud : vous avez donc accès à une grande variété de discours synthétisé. Avec Amazon Polly, votre application peut fournir des réponses encore plus utiles qui incluent des données en temps réel.

Amazon Polly facilite l'ajout de la parole à votre vidéo, votre présentation ou votre formation en ligne. Amazon Polly peut générer de la parole dans 24 langues, ce qui facilite l'ajout de voix aux applications qui disposent d'une audience internationale. Avec Amazon Polly, vous pouvez lire votre flux RSS, les informations ou vos e-mails et stocker des discours synthétisés sous forme de fichiers audio.

Création de contenu
GoAnimate

« Amazon Polly donne aux utilisateurs GoAnimate la possibilité de donner immédiatement une voix aux personnages qu'ils animent en utilisant notre plate-forme. Cela est particulièrement utile pour les scénarios où la voix off en direct est trop onéreuse ou demande trop de temps, comme lors du développement d'une vidéo dans plusieurs langues ou au cours de la pré-production afin d'accélérer le processus d'approbation. Le discours est intégré de façon fluide à notre riche ensemble de ressources pré-animées, ce qui renforce la facilité d'utilisation de GoAnimate et offre à nos clients à la fois efficacité et rapidité pour la mise sur le marché. »

– Alvin Hung, PDG et fondateur, GoAnimate


Amazon Polly permet aux développeurs de proposer des applications avec une expérience visuelle améliorée, notamment des fonctions de synchronisation labiale ou de surlignage des mots similaire à celui des vidéos de karaoké. Amazon Polly facilite l'interrogation d'un flux additionnel de métadonnées contenant des informations pertinentes lorsque certaines phrases, certains mots et certains sons sont prononcés. En utilisant ce flux de métadonnées en même temps que le flux audio de paroles synthétisées, les clients peuvent animer des avatars et souligner le texte prononcé en temps réel dans leur application.

Création de contenu
Wizkids

« Nous nous efforçons de rendre l'apprentissage basé sur le cloud plus attrayant et efficace pour tous, notamment les utilisateurs ayant des difficultés de lecture et d'écriture. Amazon Polly améliore notre plate-forme d'apprentissage en intégrant une synthèse vocale de grande qualité à notre suite de produits AppWriter. Il est absolument primordial pour nos utilisateurs d'avoir le surlignage en temps réel du texte en même temps qu'il est prononcé. Grâce aux Speech Marks de Polly, AppWriter peut offrir une expérience de lecture améliorée, qui s'adapte véritablement à chaque personne rencontrant des difficultés de lecture et d'écriture. »

– Stefan Pal, directeur de l'exploitation, Wizkids

Amazon Polly permet d'ajouter facilement de la voix à vos applications et jeux mobiles. Avec Amazon Polly, vous pouvez stocker des réponses vocales standard sur le périphérique, et également permettre des réponses dynamiques en temps réel telles que le dialogue de personnages dans un jeu, le classement des scores et les invitations de jeu.

Applications mobiles et de bureau
The Washington Post

« Nous voulions depuis longtemps proposer des versions audio de nos quelques 1 200 témoignages quotidiens, mais les solutions de conversion de texte par synthèse vocale existantes n'étaient, selon nous, pas rentables par rapport à la qualité vocale proposée. Avec l'arrivée d'Amazon Polly et de ses voix de grande qualité, nous avons hâte de proposer à nos lecteurs un choix plus varié et plus riche de solutions leur permettant de profiter de notre contenu. »

– Joseph Price, chef produit principal, The Washington Post


Avec Amazon Polly, vos centres de contact avec la clientèle peuvent répondre avec des voix naturelles. Vous pouvez reproduire la sortie vocale d'Amazon Polly via vos systèmes de réponse vocale interactive (IVR). Il est également possible d'utiliser l'API d'Amazon Polly pour fournir des informations automatisées en temps réel telles que l'état du service, des réponses aux demandes de renseignements sur le compte et la facturation ou les adresses et les coordonnées.

Centre de contact avec la clientèle

Amazon Polly permet de nouveaux cas d'utilisation d'Internet des objets (IoT) en rendant facile et peu coûteux d'ajouter la parole aux dispositifs IoT. Les dispositifs IoT peuvent utiliser la parole pour donner des réponses et des notifications naturelles, rendant les applications plus accessibles et permettant aux utilisateurs de consommer des informations sans avoir à s'appuyer sur un écran. Avec Amazon Polly, vous pouvez générer des fichiers vocaux et les stocker sur vos appareils pour une lecture hors ligne.

Utilisez AWS Lambda pour générer des adresses URL Polly pré-signées à partir des événements du moteur de règles IoT AWS, puis utilisez Device Gateway pour envoyer ces URL à vos périphériques IoT afin de leur permettre de demander des discours réalistes.

Internet des objets (IdO)

Amazon Polly peut être utilisé pour améliorer la facilité d'utilisation des applications qui enseignent aux gens de nouvelles langues. Par exemple, les utilisateurs finaux peuvent taper des expressions dans une langue étrangère dans votre application et les entendre énoncées par un locuteur natif. Amazon Polly prend en charge 24 langues et offre un large éventail de possibilités aux enseignants et aux étudiants.

Apprendre une langue
Duolingo

« Il n'y a pas beaucoup de choses pour lesquelles une prononciation précise est plus importante que lorsque vous apprenez une nouvelle langue. Nous avons constaté que les voix d'Amazon Polly ne sont pas seulement de grande qualité, mais sont aussi efficaces que la voix humaine naturelle pour l'enseignement d'une langue. »

– Severin Hacker, DPT, Duolingo


Avec Amazon Polly, vous pouvez créer et diffuser des informations accessibles sous forme de discours synthétisé pour les personnes malvoyantes. De cette façon, vous pouvez aider les personnes ayant une déficience visuelle à consommer divers contenus comme des actualités, des livres ou des messages électroniques.

Royal National Institute of Blind People

« Nous utilisons actuellement la technologie Speech-to-Text d'Amazon pour créer et diffuser des informations accessibles sous forme de contenu audio synthétisé pour nos nombreux clients B2B et B2C, notamment des sociétés de services publics, des institutions financières et des sociétés de médias, ainsi que d'autres supports à destination de la clientèle comme des magazines et des publications. Avec l'annonce d'Amazon Polly, nous sommes enthousiasmés par la capacité de fournir une expérience encore meilleure à ces clients en fournissant des voix incroyablement réalistes qui captiveront et engageront notre public. »

- John Worsfold, responsable de la mise en œuvre des solutions, Royal National Institute of Blind People

Pour commencer à utiliser Amazon Polly, c'est très simple. Connectez-vous à la console pour commencer à générer la parole à partir de votre propre texte en quelques clics.

Mise en route