Amazon Polly testen

Registrieren Sie sich und erhalten Sie ein kostenloses Konto
Oder bei der Konsole anmelden

Das kostenlose Kontingent von Amazon Polly umfasst 5 Mio. Zeichen pro Monat während der ersten 12 Monate ab der ersten Sprachanfrage.

Details zum kostenlosen Kontingent für AWS anzeigen »


F: Was ist Amazon Polly?

Amazon Polly ist ein Service, der Text in natürliche Sprache konvertiert. Amazon Polly ermöglicht als Funktion erster Klasse vorhandenen Anwendungen das Sprechen und schafft die Möglichkeit für eine völlig neue Kategorie von sprachaktivierten Produkten, von mobilen Apps und Fahrzeugen bis hin zu Geräten und Einrichtungen. Amazon Polly verfügt über Dutzende naturgetreue Stimmen und unterstützt mehrere Sprachen. So können Sie die ideale Stimme auswählen und Ihre sprachaktivierten Anwendungen in vielen Geografien verteilen. Amazon Polly ist benutzerfreundlich – Sie senden einfach den Text, den Sie in Sprache konvertieren möchten, an die Amazon Polly-API und Amazon Polly gibt automatisch den Audiodatenstrom an die Anwendung zurück. Diesen Audiodatenstrom können Sie dann direkt wiedergeben oder in einem Standardformat für Audiodateien wie z. B. MP3 speichern. Amazon Polly unterstützt SSML-Tags (Speech Synthesis Markup Language) wie Prosody. Damit können Sie das Sprechtempo sowie die Tonhöhe und die Lautstärke der Sprachausgabe anpassen. Amazon Polly ist ein sicherer Service, der all diese Vorteile bei umfangreicher Skalierung und geringer Latenz bietet. Sie können die durch Amazon Polly generierten Sprachdateien ohne Zusatzkosten zwischenspeichern und erneut abspielen. Mit Amazon Polly können Sie im ersten Jahr ab Anmeldung 5 Mio. Zeichen pro Monat kostenlos umwandeln. Amazon Polly bietet dank der nutzungsbasierten Bezahlung, der geringen Gebühr pro Abfrage und der uneingeschränkten Speicher- und Wiederverwendungsmöglichkeit der Sprachausgabe eine kosteneffiziente Alternative für die Sprachsynthese überall.

F: Weshalb sollte ich Amazon Polly verwenden?

Sie können Amazon Polly verwenden, um Ihre Anwendung durch eine hochwertige Sprachausgabe zu unterstützen. Dieser kosteneffiziente Service bietet äußerst geringe Antwortzeiten und ist praktisch für jeden Anwendungsfall verfügbar, wobei keine Einschränkungen bei der Speicherung und Wiederverwendung der generierten Sprachausgabe bestehen.

F: Welche Funktionen werden unterstützt?

Sie können verschiedene Aspekte der Sprache wie z. B. Aussprache, Lautstärke, Tonhöhe, Sprechtempo usw. steuern. unter Verwendung der standardisierten Speech Synthesis Markup Language (SSML) steuern. Anhand der im Audio-Stream enthaltenen Metadaten können Sie erkennen, wann bestimmte Wörter oder Sätze im Text an den Benutzer gesprochen werden. Auf diese Weise kann der Entwickler grafische Hervorhebungen und Animationen, wie etwa die Lippenbewegungen eines Avatars, mit der synthetisierten Sprache synchronisieren. Sie können die Aussprache bestimmter Wörter wie Firmennamen, Akronyme, Fremdwörter und Wortneuschöpfungen, z. B."P!nk", "ROTFL", "C’est la vie" (bei Aussprache in einer anderen Sprache als Französisch) unter Verwendung von benutzerdefinierten Wörterbüchern bearbeiten.

F: Was sind Speech Marks?

Speech Marks wurden entwickelt, um die synthetisierte Sprache, die aus dem Eingabetext generiert wird, zu ergänzen. Mithilfe dieser Metadaten und des Audio-Streams mit synthetisierter Sprache können Kunden Ihren Anwendungen eine erweiterte visuelle Erfahrung verleihen, wie etwa sprachsynchronisierte Animationen oder Hervorhebungen im Karaoke-Stil.

Amazon Polly generiert Speech Marks mithilfe der folgenden vier Elemente:

1) Satz: weist auf ein Satzelement im zu sprechenden Eingabetext hin;

2) Wort: weist auf ein Wortelement im Text hin;

3) Mundbild: beschreibt die Form der Lippen, die dem gesprochenen Laut entspricht;

4) SSML: beschreibt ein im Text verwendetes SSML-Element.

Bei Verwendung der Methode einer synthetisierten Sprache mit dem Parameter für Speech Mark-Typen werden Speech Marks in Form eines JSON-Streams bereitgestellt – genauer gesagt, durch eine Gruppe eigenständiger JSON-Objekte, die jeweils durch neue Zeilen abgegrenzt sind. Sie können eines, aber auch alle vier dieser Elemente enthalten. Weitere Informationen finden Sie im Entwicklerhandbuch für Amazon Polly.

F: Was sind die häufigsten Anwendungsfälle für diesen Service?

Mit Amazon Polly können Sie Ihren Anwendungen Leben einhauchen, indem Sie ihnen naturgetreue Sprachfunktionen hinzufügen. Sie können beispielsweise im Bildungs- und E-Learning-Bereich die Text-zu-Sprache-Funktion (TTS) von Amazon Polly nutzen, um Anwendungen zu erstellen, die Personen mit Leseschwächen unterstützen. Amazon Polly kann verwendet werden, um blinden und sehbehinderten Menschen den Konsum von digitalem Inhalt (eBooks, Nachrichten usw.) zu ermöglichen. Amazon Polly kann für Ansagesysteme in öffentlichen Verkehrsmitteln und bei Industriesteuerungen für Benachrichtigungen und Notfallansagen eingesetzt werden. Es gibt eine Vielzahl von Geräten, wie Set-Top-Boxen, Smartwatches, Tablets, Smartphones und IoT-Geräte, die Amazon Polly für die Sprachausgabe nutzen können. Amazon Polly kann für Telefonielösungen verwendet werden, um interaktiven Sprachantwortsystemen eine Stimme zu verleihen. Anwendungen wie Ratespiele, Animationen, Avatars oder Audiokommentare sind häufige Anwendungsfälle für cloudbasierte TTS-Lösungen wie Amazon Polly.

F: Wie funktioniert das Produkt mit anderen AWS-Produkten?

In Kombination mit Amazon Lex können Entwickler komplette Benutzerschnittstellen für Spracheingabe für ihre Anwendungen erstellen. Innerhalb von Amazon Connect wird Amazon Polly-Sprache verwendet, um Cloud-basierte Kontaktcenter-Self-Service-Services zu erstellen. Darüber hinaus können Entwickler von mobilen Apps und Lösungen für das Internet der Dinge (IoT) Amazon Polly nutzen, um ihren eigenen Systemen eine Sprachausgabe hinzuzufügen.

F: Welche Vorteile hat eine cloudbasierte Text-zu-Sprache-Lösung gegenüber einer gerätebasierten Lösung?

Bei gerätebasierten Text-zu-Sprache-Lösungen müssen erhebliche Rechenressourcen, insbesondere CPU-Leistung, RAM und Festplattenspeicher, auf dem Gerät zur Verfügung stehen. Dies kann zu höheren Entwicklungskosten und höherem Energiebedarf bei Geräten wie Tablets, Smartphones usw. führen. Im Gegensatz dazu reduziert die Umwandlung von Text zu Sprache in der Cloud deutlich den lokalen Ressourcenbedarf. Dies ermöglicht die Unterstützung aller verfügbaren Sprachen und Stimmen in bestmöglicher Qualität. Darüber hinaus sind Sprachkorrekturen und -verbesserungen für alle Endbenutzer sofort verfügbar und erfordern keine zusätzliche Aktualisierung aller Geräte. Cloudbasiertes TTS (Text-zu-Sprache) ist plattformunabhängig und verringert die Zeit und den Aufwand bei der Entwicklung.

F: Was sind die ersten Schritte bei Amazon Polly?

Melden Sie sich einfach an Ihrem AWS-Konto an und navigieren Sie zur Amazon Polly-Konsole (Teil der AWS-Konsole). Sie können dann über die Konsole einen beliebigen Text eingeben und den erzeugten Audiodatenstrom wiedergeben oder ihn als Audiodatei speichern.

F: In welchen Regionen ist der Service verfügbar?

Zugriff auf Amazon Polly erhalten Sie weltweit aus den folgenden 14 AWS-Regionen: Asien-Pazifik (Mumbai), Asien-Pazifik (Seoul), Asien-Pazifik (Singapur), Asien-Pazifik (Sydney), Asien-Pazifik (Tokio), Kanada (Zentral), EU (Frankfurt), EU (Irland), EU (London), Südamerika (São Paulo), USA Ost (Nord-Virginia), USA Ost (Ohio), USA West (Nordkalifornien), USA West (Oregon).

F: Welche Programmiersprachen werden unterstützt?

Amazon Polly unterstützt alle im AWS SDK (Java, Node.js, .NET, PHP, Python, Ruby, Go und C++) und AWS SDK für Mobilgeräte (iOS/Android) enthaltenen Programmiersprachen. Amazon Polly unterstützt auch die HTTP-API, so dass Sie Ihre eigene Zugriffsebene implementieren können.

F: Welche Audioformate werden unterstützt?

Mit Amazon Polly können Sie Audiodaten in Fast-Echtzeit an Benutzer übertragen. Sie haben die Auswahl zwischen verschiedenen Samplingrates zur Optimierung der Bandbreite und der Audioqualität für Ihre Anwendung. Amazon Polly unterstützt MP3, Vorbis und rohe PCM-Audiodatenstromformate.

F: Welche Sprachen werden unterstützt?

Amerikanisches Englisch Niederländisch Koreanisch Amerikanisches Spanisch
Australisches Englisch Französisch Polnisch Schwedisch
Britisches Englisch Kanadisches Französisch
Portugiesisch Türkisch
Indisches Englisch Deutsch Brasilianisches Portugiesisch
Norwegisch
Walisisches Englisch Isländisch Rumänisch  
Walisisch Italienisch Russisch
  
Dänisch Japanisch Kastilisches Spanisch
 

F: Gibt es AWS-Service-Limits für Amazon Polly?

AWS hat Service-Limits für alle Konten, um die Verfügbarkeit der AWS-Ressourcen garantieren und die Risiken für neue Kunden in Hinblick auf die Fakturierung minimal halten zu können. Wenn Sie Amazon Polly zur Ausführung Ihrer Anwendung mit hohem Qualitätsdurchsatz nutzen, gibt es hierfür standardmäßige Service-Limits, einschließlich Drosselungsgrenzen, und Beschränkungen zur Nutzung von Vorgängen und der SSML (Speech Synthesis Markup Language). Weitere Informationen finden Sie im Amazon Polly Entwicklerhandbuch unter Limits in Amazon Polly. Durch die Kombination mit anderen AWS Services, wie AWS Batch für eine effizientere Batch-Verarbeitung, können Sie für eine optimale Nutzung von Amazon Polly innerhalb der Service-Limits sorgen.


F: Wie viel kostet Amazon Polly?

Aktuelle Preisinformationen finden Sie auf der Seite mit der Preisübersicht für Amazon Polly.

F: Kann ich den Service zum Erzeugen von statischen Sprachansagen verwenden, die mehrmals wiedergegeben werden?

Ja, das ist möglich. Es besteht keine Einschränkung dieser Funktion und es entstehen keine zusätzlichen Kosten.

F: Kann ich den Service zum Erzeugen von Inhalt verwenden, der in Massenansagesystemen (z. B. an Bahnhöfen) verwendet wird?

Ja, das ist möglich. Es besteht keine Einschränkung dieser Funktion und es entstehen keine zusätzlichen Kosten.

F: Ich fordere die Synthetisierung von 1 000 Zeichen und Speech Marks mit den gleichen 1 000 Zeichen an. Werden mir in diesem Fall 2 000 Zeichen in Rechnung gestellt?

Ja. Ihnen werden für jede Anforderung von Sprache oder Speech Marks basierend auf der Anzahl der Zeichen, die Sie an den Service senden, alle Zeichen in Rechnung gestellt.

F: Ist Amazon Polly Teil des kostenlosen AWS-Nutzungskontingents?

Ja, im Rahmen des kostenlosen Nutzungskontingents von AWS können Sie Amazon Polly zum Einstieg kostenlos nutzen. Nach der Anmeldung bei Amazon Polly können neue Kunden jeden Monat bis zu 5 Mio. Zeichen kostenlos während der ersten 12 Monate synthetisieren.

F: Sind Steuern im Preis enthalten?

Weitere Einzelheiten finden Sie unter Amazon Web Services – Steuerhilfe.


F: Verwendet Amazon Polly meinen Inhalt zur Verbesserung des Service? Wie sieht der Datenschutz bei Amazon Polly aus?

Amazon Polly kann Ihren Inhalt zur Verbesserung der Qualität unseres Serviceangebots und anderer Produkte und Services hinsichtlich Machine Learning, die von AWS und seinen verbundenen Unternehmen angeboten werden, verwenden. Ihr Inhalt ist zu einem gewissen Grad für die Weiterentwicklung der zugrunde liegenden Technologie und für die Verbesserung der Benutzererfahrung von Amazon Polly entscheidend. Ihr Vertrauen sowie der Schutz Ihrer Privatsphäre und Ihres Inhalts haben bei uns höchste Priorität und wir implementieren zuverlässige und fortschrittliche technische und physische Kontrollen, um einen unberechtigten Zugriff auf Ihren Inhalt oder dessen Offenlegung zu verhindern und um sicherzustellen, dass unsere Verwendung Ihres Inhalts unserer Verpflichtung Ihnen gegenüber entspricht. Weitere Informationen finden Sie unter Häufig gestellte Fragen zum AWS-Datenschutz.