Einfach verwendbare API

Amazon Polly bietet eine API, die es Ihnen ermöglicht, die Sprachsynthese schnell in Ihre Anwendung zu integrieren. Sie senden einfach den Text, der in Sprache umgewandelt werden soll, an die Amazon Polly-API, und Amazon Polly gibt sofort den Audiostream an Ihre Anwendung aus, sodass Ihre Anwendung ihn direkt abspielen oder in einem Standard-Audioformat wie MP3 abspeichern kann.

Abtastrate Beispiel-Code
Hi. My name is Joanna. from boto3 import client
polly = client("polly", region_name="us-east-1")
response = polly.synthesize_speech(
        Text="Hallo. My name is Joanna.",
        OutputFormat="mp3",
        VoiceId="Joanna")

Große Auswahl an Stimmen und Sprachen

Amazon Polly beinhaltet Dutzende natürliche Stimmen und unterstützt mehrere Sprachen, sodass Sie die ideale Stimme auswählen und ihre sprachaktivierten Anwendungen in vielen Ländern vertreiben können.

Sprache Weiblich
Männlich
Australisches Englisch Nicole Russell
Brasilianisches Portugiesisch Vitória Ricardo
Kanadisches Französisch Chantal  
Dänisch Naja Mads
Niederländisch Lotte Ruben
Französisch

Léa

Céline

Mathieu

 

Deutsch Vicki Hans
  Marlene  
Hindi Aditi
 
Isländisch Dóra Karl
Indisches Englisch

Raveena

Aditi

 
Italienisch Carla Giorgio
Japanisch Mizuki Takumi
Koreanisch Seoyeon  
Mandarin-Chinesisch Zhiyu  
Norwegisch Liv  
Polnisch Ewa Jacek
  Maja Jan
Iberisches Portugiesisch Inês Cristiano
Rumänisch Carmen  
Russisch Tatyana Maxim
Kastilisches Spanisch Conchita Enrique
Schwedisch Astrid  
Türkisch Filiz  
Britisches Englisch Amy Brian
  Emma  
US-amerikanisches Englisch Joanna Matthew
  Salli Justin
  Kendra Joey
  Kimberly  
  Ivy  
US-amerikanisches Spanisch Penélope Miguel
Walisisch Gwyneth  
Walisisches Englisch   Geraint

Synchronisieren von Sprache für eine erweiterte visuelle Erfahrung

Amazon Polly vereinfacht das Anfordern eines zusätzlichen Metadaten-Streams, der Informationen zur Aussprache bestimmter Sätze, Wörter und Laute bereitstellt. Mithilfe dieses Metadaten-Streams und des Audio-Streams mit synthetisierter Sprache können Sie jetzt Anwendungen mit erweiterter visueller Erfahrung erstellen, beispielsweise sprachsynchronisierte Gesichtsanimationen oder Worthervorhebungen im Karaoke-Stil.

Weitere Informationen zum Verwenden von Speech Marks finden Sie in der Dokumentation

Optimieren Sie die Streaming-Qualität der Audio-Dateien

Mit Amazon Polly können Sie vielerlei Informationen fast in Echtzeit über Ihre Anwendung streamen und Benutzern zur Verfügung stellen. Außerdem können Sie aus vielen Abtastraten auswählen, um Bandbreite und Tonqualität für Ihre Anwendung zu optimieren. Amazon Polly unterstützt MP3, Vorbis und unkomprimierte PCM-Audiostream-Formate.

Abtastrate MP3-Größe   Größe OGG
Größe PCM
22,05 kHz Anhören
19,02 KB 19,14 KB N/A
16,05 kHz Anhören 16,04 KB
16,35 KB
99,53 KB
8,00 kHz Anhören 13,26 KB 10,40 KB 49,76 KB

Sprachgeschwindigkeit, Tonlage und Lautstärke anpassen

Amazon Polly unterstützt die Speech Synthesis Markup Language (SSML), eine vom W3C standardisierte und auf XML basierende Auszeichnungssprache für Anwendungen zur Sprachsynthese, sowie gängige SSML-Tags zu Ausdrucksweise, Betonung und Tonfall. Diese Flexibilität ermöglicht es Ihnen, natürliche Sprache zu erzeugen, die die Aufmerksamkeit Ihrer Zielgruppe auf sich zieht und aufrecht erhält.

Weitere Informationen finden Sie in der Amazon Polly-Dokumentation zu SSML-Tags.

Beispiel SSML
So spreche ich normalerweise. (keins)
Ich kann mit einer höheren oder in einer niedrigeren Tonlage sprechen. <speak>I can speak in a <prosody pitch="high">higher pitched voice</prosody>, or I can speak <prosody pitch="low">in a lower pitched voice</prosody></speak>
Ich kann ganz langsam oder richtig schnell sprechen. <speak>I can speak <prosody rate="x-slow">really slowly</prosody>, or  I can speak <prosody rate="x-fast">really fast</prosody></speak>
Ich kann auch sehr laut oder sehr leise sprechen. <speak>Ich kann auch <prosody volume="x-loud">sehr laut</prosody> oder <prosody volume="x-soft">sehr leise</prosody> sprechen.
Ich kann flüstern. <speak>Ich muss Ihnen ein Geheimnis erzählen, ich werde es Ihnen zuflüstern.<amazon:effect name="whispered">'<prosody rate="x-slow"> <prosody volume="loud">Ich bin kein Mensch.</prosody></prosody></amazon:effect>Können Sie das glauben?</speak>

Maximale Sprechdauer anpassen

Mit Amazon Polly können Sie das Sprechtempo automatisch durch eine maximale Sprechdauer anpassen. Die Sprechdauer legen Sie mittels einer als zeitgesteuerte Intonation bezeichneten Funktion fest. Dies ist in vielen Anwendungsfällen nützlich, insbesondere bei der Sprachlokalisierung.

Nehmen wir beispielsweise an, in Ihrem Trainingsvideo ist in US-Englisch gesprochener Text eingebettet, und Sie möchten das Video ins Deutsche lokalisieren. Nehmen wir an, Sie übersetzen den Text mit Amazon Translate und verwenden für die Sprachausgabe Polly. Wichtig ist dabei, dass der lokalisierte deutsche Text in entsprechenden Zeitrahmen im Video gesprochen wird. Der deutsche gesprochene Text darf somit nicht länger als der englische Text sein. Sie können mit dieser Funktion die Synchronisierung erleichtern.

Plattform- und Programmiersprachen-Support

Amazon Polly unterstützt alle Programmiersprachen des AWS SDK (Java, Node.js, .NET, PHP, Python, Ruby, Go, and C++) und des AWS Mobile SDK (iOS/Android). Außerdem unterstützt Polly eine HTTP-API, sodass Sie Ihre eigene Zugriffsebene implementieren können.

Sprachsynthese über die API, die Konsole oder die Befehlszeile

Amazon Polly kann über die Polly-API (und zahlreiche sprachspezifische SDKs), die AWS Management Console und die AWS-Befehlszeilenschnittstelle (CLI) verwaltet werden. Sie haben vollständige Kontrolle über alle Funktionen von Amazon Polly, egal ob Sie den Service über die Konsole, die API oder die CLI verwenden.

Benutzerdefinierte Lexika

Mit den benutzerdefinierten Lexika oder Wörterlisten von Amazon Polly können Sie die Aussprache bestimmter Wörter, zum Beispiel von Firmennamen, Akronymen, Fremdwörtern und Neologismen (z. B. „ROTFL“, „C’est la vie“ für nicht französischsprachige Stimmen) modifizieren. Um die Aussprache anzupassen, laden Sie eine XML-Datei mit lexikalischen Einträgen hoch. Sie können beispielsweise die Aussprachen von Nguyen anpassen, indem Sie ein Phonem in der folgenden XML-Datei zur Verfügung stellen:

<lexeme>
            <grapheme>Nguyen</grapheme>
            <grapheme>nguyen</grapheme>
            <grapheme>NGUYEN</grapheme>
            <phoneme>"nu.jEn'</phoneme>
</lexeme>

Weitere Informationen zu den Preisen von Amazon Polly

Zur Seite mit den Preisen
Sind Sie startbereit?
Registrieren
Haben Sie Fragen?
Kontakt