Démarrage avec Amazon Polly

Amazon Polly est un service qui convertit le texte en un enregistrement audio réaliste. Polly vous permet de créer des applications parlantes, vous donnant la possibilité de concevoir de toutes nouvelles catégories de produits vocaux. Polly est un service Amazon AI qui exploite des technologies avancées d'apprentissage en profondeur pour synthétiser la parole d'une manière qui la faire ressembler à une voix humaine. Polly comprend 47 voix réalistes dans 24 langues. Vous pouvez ainsi sélectionner la voix idéale et créer des applications vocales qui fonctionnent dans de nombreux pays différents.

Amazon Polly offre les temps de réponse toujours rapides nécessaires pour prendre en charge le dialogue interactif en temps réel. Vous pouvez mettre en cache et enregistrer le discours de Polly pour le rejouer en mode hors connexion ou redistribuer. Et Polly est facile à utiliser. Il vous suffit d'envoyer le texte que vous voulez convertir en discours sur l'API de Polly, et Polly renvoie immédiatement le flux audio à votre application afin qu'elle puisse le lire directement ou le stocker sous un format de fichier audio standard, comme le MP3.

Avec Polly, vous ne payez que le nombre de caractères que vous convertissez en discours, et vous pouvez les enregistrer et les réécouter. Le faible coût par caractère converti de Polly et l'absence de restrictions sur le stockage et la réutilisation du fichier audio en font un moyen rentable d'activer Text-to-Speech partout.

Adobe Flash Player ou un navigateur moderne sont requis pour regarder les vidéos sur ce site.

Introducing Amazon Polly
1:20
Amazon Polly : AWS re:Invent 2016
Langue Femme Homme Modèle de texte
Anglais Joanna Joey Hello. Do you speak a foreign language? One language is never enough.
Danois Naja Mads Hej. Taler du et fremmed sprog? Et sprog er aldrig nok.
Brésilien Vitória Ricardo Oi. Você fala algum idioma estrangeiro? Somente um idioma nunca é bastante.
Espagnol Penélope Miguel Hola. ¿Hablas algún idioma extranjero? Un solo idioma no es suficiente.
Islandais Dóra Karl Halló, Hæ talar þú erlent tungumál? Eitt tungumál er aldrei nóg.
Des voix naturelles

Des voix naturelles

Amazon Polly offre 47 voix réalistes et prend en charge 24 langues, y compris un large éventail de voix masculines et féminines avec une variété d'accents. La prononciation fluide de texte de Polly dans plusieurs langues vous permet d'offrir des sorties vocales de grande qualité et de créer des applications pour les utilisateurs internationaux.

Une intégration facile

Une intégration facile

Amazon Polly permet d'ajouter facilement de la voix à votre site Web, à votre application mobile ou à votre appareil. Avec Polly, il suffit d'écrire le texte que vous voulez convertir en discours sur l'API de Polly, qui renvoie immédiatement le flux audio. Contrairement à d'autres solutions qui nécessitent un long processus d'approbation, Polly ne vous demande pas de décrire comment vous utiliserez le discours de Polly dans votre application, et il n'y a pas de contrats de distribution à signer : vous pouvez donc commencer tout de suite.

Enregistrer et redistribuer la parole

Enregistrer et redistribuer la parole

Contrairement à d'autres solutions qui nécessitent une redevance ou des frais chaque fois que vous réutilisez le fichier audio généré précédemment, Amazon Polly permet de le rejouer de manière illimitée sans frais supplémentaires. Ces rediffusions gratuites s'appliquent également au mode hors connexion. Vous pouvez créer des fichiers vocaux dans divers formats standard, tels que MP3 et OGG, et les stocker sur des périphériques tels que des téléphones mobiles ou des périphériques Internet des Objets (IoT) pour la lecture hors ligne.

 

Coût réduit

Coût réduit

La tarification à la carte, le faible coût par caractère converti et les rediffusions illimitées d'Amazon Polly en font un moyen rentable d'adopter la synthèse vocale dans absolument n'importe quelle application.

Réponse rapide

Réponse rapide

Offrir des voix réalistes et des expériences utilisateur conversationnelles requiert des temps de réponse constamment rapides. Les applications vocales ont besoin de lire la parole synthétisée sans temps de latence.Prenez par exemple les applications qui fournissent des instructions vocales pour la navigation, les applications d'apprentissage en ligne qui fournissent des instructions orales aux étudiants et les applications qui interagissent avec l'utilisateur par le dialogue en temps réel. Ces applications sont plus efficaces lorsque les réponses peuvent commencer sans que des retards soient perçus dans le flux de la conversation. Même lorsque vous envoyez un long texte à l'API de Polly, il renvoie l'audio à votre application en tant que flux afin que vous puissiez lire les voix immédiatement. Ces types de réponses orales dynamiques nécessitent l'accès à une quantité de discours oral beaucoup plus importante que ce qui est généralement disponible pour le stockage sur les appareils des utilisateurs. Amazon Polly est hébergé dans le cloud : vous avez donc accès à une grande variété de discours synthétisé. Avec Polly, votre application peut fournir des réponses encore plus précieuses qui incluent des données en temps réel.

Amazon Polly facilite l'ajout de la parole à votre vidéo, votre présentation ou votre formation en ligne. Polly peut générer de la parole en 24 langues, ce qui facilite l'ajout de voix aux applications qui disposent d'une audience internationale. Avec Polly, vous pouvez lire votre flux RSS, les informations ou vos e-mails et stocker des discours synthétisés sous forme de fichiers audio.

Création de contenu
GoAnimate

« Amazon Polly donne aux utilisateurs GoAnimate la possibilité de donner immédiatement une voix aux personnages qu'ils animent en utilisant notre plate-forme. Cela est particulièrement utile pour les scénarios où la voix off en direct est trop onéreuse ou demande trop de temps, comme lors du développement d'une vidéo dans plusieurs langues ou au cours de la pré-production afin d'accélérer le processus d'approbation. Le discours est intégré de façon fluide à notre riche ensemble de ressources pré-animées, ce qui renforce la facilité d'utilisation de GoAnimate et offre à nos clients à la fois efficacité et rapidité pour la mise sur le marché. »

– Alvin Hung, PDG et fondateur, GoAnimate


Amazon Polly permet aux développeurs de proposer des applications avec une expérience visuelle améliorée, notamment des fonctions de synchronisation labiale ou de surlignage des mots similaire à celui des vidéos de karaoké. Amazon Polly facilite l'interrogation d'un flux additionnel de métadonnées contenant des informations pertinentes lorsque certaines phrases, certains mots et certains sons sont prononcés. En utilisant ce flux de métadonnées en même temps que le flux audio de paroles synthétisées, les clients peuvent animer des avatars et souligner le texte prononcé en temps réel dans leur application.

Création de contenu
Wizkids

« Nous nous efforçons de rendre l'apprentissage basé sur le cloud plus attrayant et efficace pour tous, notamment les utilisateurs ayant des difficultés de lecture et d'écriture. Amazon Polly améliore notre plate-forme d'apprentissage en intégrant une synthèse vocale de grande qualité à notre suite de produits AppWriter. Il est absolument primordial pour nos utilisateurs d'avoir le surlignage en temps réel du texte en même temps qu'il est prononcé. Grâce aux Speech Marks de Polly, AppWriter peut offrir une expérience de lecture améliorée, qui s'adapte véritablement à chaque personne rencontrant des difficultés de lecture et d'écriture. »

– Stefan Pal, directeur de l'exploitation, Wizkids

Amazon Polly permet d'ajouter facilement de la voix à vos applications et jeux mobiles. Avec Polly, vous pouvez stocker des réponses vocales standard sur le périphérique, et également permettre des réponses dynamiques en temps réel telles que le dialogue de personnages dans un jeu, le classement des scores et les invitations de jeu.

Applications mobiles et de bureau
The Washington Post

« Nous voulions depuis longtemps proposer des versions audio de nos quelques 1 200 témoignages quotidiens, mais les solutions de conversion de texte par synthèse vocale existantes n'étaient, selon nous, pas rentables par rapport à la qualité vocale proposée. Avec l'arrivée d'Amazon Polly et de ses voix de grande qualité, nous avons hâte de proposer à nos lecteurs un choix plus varié et plus riche de solutions leur permettant de profiter de notre contenu. »

– Joseph Price, chef produit principal, The Washington Post


Avec Amazon Polly, vos centres de contact avec la clientèle peuvent répondre avec des voix naturelles. Vous pouvez reproduire la sortie vocale de Polly via vos systèmes de réponse vocale interactive (IVR). De plus, vous pouvez utiliser l'API de Polly pour fournir des informations automatisées en temps réel telles que l'état du service, des réponses aux demandes de renseignements sur le compte et la facturation ou les adresses et les coordonnées.

Centre de contact avec la clientèle

Amazon Polly permet de nouveaux cas d'utilisation d'Internet des objets (IoT) en rendant facile et peu coûteux d'ajouter la parole aux dispositifs IoT. Les dispositifs IoT peuvent utiliser la parole pour donner des réponses et des notifications naturelles, rendant les applications plus accessibles et permettant aux utilisateurs de consommer des informations sans avoir à s'appuyer sur un écran. Avec Polly, vous pouvez générer des fichiers vocaux et les stocker sur vos appareils pour une lecture hors ligne.

Utilisez AWS Lambda pour générer des adresses URL Polly pré-signées à partir des événements du moteur de règles IoT AWS, puis utilisez Device Gateway pour envoyer ces URL à vos périphériques IoT afin de leur permettre de demander des discours réalistes.

Internet des objets (IdO)

Amazon Polly peut être utilisé pour améliorer la facilité d'utilisation des applications qui enseignent aux gens de nouvelles langues. Par exemple, les utilisateurs finaux peuvent taper des expressions dans une langue étrangère dans votre application et les entendre énoncées par un locuteur natif. Polly prend en charge 24 langues, donnant aux enseignants et aux étudiants beaucoup de choix.

Apprendre une langue
Duolingo

« Il n'y a pas beaucoup de choses pour lesquelles une prononciation précise est plus importante que lorsque vous apprenez une nouvelle langue. Nous avons constaté que les voix d'Amazon Polly ne sont pas seulement de grande qualité, mais sont aussi efficaces que la voix humaine naturelle pour l'enseignement d'une langue. »

– Severin Hacker, DPT, Duolingo


Avec Amazon Polly, vous pouvez créer et diffuser des informations accessibles sous forme de discours synthétisé pour les personnes malvoyantes. De cette façon, vous pouvez aider les personnes ayant une déficience visuelle à consommer divers contenus comme des actualités, des livres ou des messages électroniques.

Royal National Institute of Blind People

« Nous utilisons actuellement la technologie Speech-to-Text d'Amazon pour créer et diffuser des informations accessibles sous forme de contenu audio synthétisé pour nos nombreux clients B2B et B2C, notamment des sociétés de services publics, des institutions financières et des sociétés de médias, ainsi que d'autres supports à destination de la clientèle comme des magazines et des publications. Avec l'annonce d'Amazon Polly, nous sommes enthousiasmés par la capacité de fournir une expérience encore meilleure à ces clients en fournissant des voix incroyablement réalistes qui captiveront et engageront notre public. »

- John Worsfold, responsable de la mise en œuvre des solutions, Royal National Institute of Blind People

Pour commencer à utiliser Polly, c'est très simple. Connectez-vous à la console pour commencer à générer la parole à partir de votre propre texte en quelques clics.

Mise en route