Amazon Polly est un service qui convertit le texte en un enregistrement audio réaliste. Amazon Polly inclut  voix réalistes et prend en charge  langues. Vous pouvez alors choisir la voix idéale et distribuer vos applications parlantes dans de nombreux pays. Avec Amazon Polly, il vous suffit d'envoyer le texte que vous voulez convertir en discours sur l'API d'Amazon Polly. Amazon Polly renvoie immédiatement le flux audio à votre application, afin que vous puissiez le lire directement ou le stocker sous un format de fichier audio standard, comme le MP3.

Essayer Amazon Polly

Créer un compte gratuitement
Vous pouvez également vous connecter à la console

L'offre gratuite Amazon Polly inclut 5 millions de caractères par mois pour les 12 premiers mois, à compter de la première demande de discours.

Voir les détails relatifs à l'offre gratuite d'AWS »

Amazon Polly propose une API qui vous permet d'intégrer rapidement une synthèse vocale à votre application. Il vous suffit d'envoyer le texte que vous voulez convertir en audio à l'API d'Amazon Polly pour qu'Amazon Polly renvoie directement l'enregistrement audio à votre application. Vous pouvez ensuite le diffuser directement en streaming ou le stocker dans un format de fichier audio standard, comme le MP3.

Taux d'échantillonnage Exemple de code
« Bonjour. Je m'appelle Joanna. » depuis le client d'importation boto3
polly = client("polly", region_name="us-east-1")
response = polly.synthesize_speech(
        Text="Bonjour. Je m'appelle Joanna.",
        OutputFormat="mp3",
        VoiceId="Joanna")

Amazon Polly inclut  voix réalistes et prend en charge  langues. Vous pouvez alors choisir la voix idéale et distribuer vos applications parlantes dans de nombreux pays.

Langue Femme
Homme
Anglais australien Nicole Russell
Portugais brésilien Vitória Ricardo
Français canadien Chantal  
Danois Naja Mads
Néerlandais Lotte Ruben
Français Céline Mathieu
Allemand Vicki Hans
  Marlene  
Islandais Dóra Karl
Anglais indien Raveena  
  Aditi  
Italien Carla Giorgio
Japonais Mizuki Takumi
Coréen Seoyeon  
Norvégien Liv  
Polonais Ewa Jacek
  Maja Jan
Portugais – ibérique Inês Cristiano
Roumain Carmen  
Russe Tatyana Maxim
Espagnol – castillan Conchita Enrique
Suédois Astrid  
Turc Filiz  
Anglais britannique Amy Brian
  Emma  
Anglais américain Joanna Matthew
  Salli Justin
  Kendra Joey
  Kimberly  
  Ivy  
Espagnol américain Penélope Miguel
Gallois Gwyneth  
Anglais gallois   Geraint

Amazon Polly facilite l'interrogation d'un flux additionnel de métadonnées offrant des informations pertinentes lorsque certaines phrases, certains mots et certains sons sont prononcés. En utilisant ce flux de métadonnées en même temps que le flux audio de paroles synthétisées, vous pouvez à présent proposer des applications avec une expérience visuelle améliorée, notamment des fonctions de synchronisation labiale ou de surlignage des mots similaire à celui des vidéos de karaoké.

Veuillez consulter la documentation pour en savoir plus sur l'utilisation des Speech Marks.

Avec Amazon Polly, vous pouvez diffuser toutes sortes d'informations à vos utilisateurs en temps presque réel grâce à votre application. Vous pouvez également choisir différents taux d'échantillonnage pour optimiser la bande passante et la qualité audio de votre application. Amazon Polly prend en charge les formats audio MP3, Vorbis et PCM brut.

Taux d'échantillonnage Taille au format MP3   Taille au format OGG
Taille au format PCM
22,05 kHz Ecouter
19,02 Ko 19,14 Ko N/A
16,05 kHz Ecouter 16,04 Ko
16,35 Ko
99,53 Ko
8,00 kHz Ecouter 13,26 Ko 10,40 Ko 49,76 Ko

Amazon Polly prend en charge le Speech Synthesis Markup Language (SSML), un langage de balisage de standard W3C basé sur du XML pour les applications à synthèse vocale, et les balises habituelles du SSML pour le phrasé, l'accent et l'intonation. Cette flexibilité vous permet de créer un discours réaliste qui attirera votre public et retiendra son attention.

Pour en savoir plus, consultez la documentation Amazon Polly sur les balises SSML.

Exemple SSML
En temps normal, je parle de cette façon. (aucun)
Je peux parler avec une voix plus haute ou avec une voix plus basse. Je peux parler avec une voix plus haute ou avec une voix plus basse
Je peux parler très lentement ou très rapidement. Je peux parler très lentement ou très rapidement
Je peux également parler très fort ou très doucement. Je peux également parler très fort ou très doucement .
Je sais chuchoter. J'ai un secret à vous dire, je vais le chuchoter. ' Je ne suis pas humaine. Incroyable, n'est-ce pas ?

Amazon Polly prend en charge tous les langages de programmation inclus dans les kits SDK AWS (Java, Node.js, .NET, PHP, Python, Ruby, Go et C++) et AWS Mobile (iOS/Android). Polly prend également en charge une API HTTP afin que vous puissiez mettre en place votre propre couche d'accès.

Amazon Polly est accessible en utilisant l'API Polly (et différents kits SDK propres à chaque langue), AWS Management Console et l'interface de ligne de commande AWS. Que vous utilisiez Amazon Polly depuis la console, l'API ou l'interface de ligne de commande, vous avez un contrôle total sur toutes ses fonctionnalités.

Grâce aux glossaires ou lexiques personnalisés d'Amazon Polly, vous pouvez modifier la prononciation de certains mots, tels que des noms d'entreprises, des acronymes, des mots étrangers ou des néologismes (par exemple « ROTFL », « C'est la vie » dit dans une voix non-française). Pour personnaliser ces prononciations, vous importez un fichier XML avec les entrées lexicales. Par exemple vous pouvez personnaliser la prononciation de « Nguyen » en fournissant un phonème avec ces balises XML :


            Nguyen
            nguyen
            NGUYEN
            "nu.jEn'