Amazon Polly

Amazon Polly – KI-Sprachgenerator

Setzen Sie hochwertige, natürlich klingende menschliche Stimmen in Dutzenden von Sprachen ein.

AWS-Konto erstellen

Erste Schritte mit Amazon Polly

Was ist Amazon Polly?

Amazon Polly ist ein vollständig verwalteter Service, der auf Abruf Sprache generiert und jeden Text in einen Audiostream umwandelt. Verwendung von Deep-Learning-Technologien zur Konvertierung von Artikeln, Webseiten, PDF-Dokumenten und anderen Text-zu-Sprache (TTS). Polly bietet Dutzende lebensechter Stimmen in einer Vielzahl von Sprachen, mit denen Sie sprachgesteuerte Anwendungen erstellen können, die engagieren und konvertieren. Erfüllen Sie die unterschiedlichen Sprach-, Zugänglichkeits- und Lernbedürfnisse von Benutzern in allen Regionen und Märkten. Leistungsstarke neuronale Netzwerke und generative Sprachmaschinen arbeiten im Hintergrund und synthetisieren Sprache für Sie. Integrieren Sie die Amazon-Polly-API in Ihre vorhandenen Anwendungen, um schnell sprachbereit zu sein.

Anwendungsfälle

Fügen Sie Anwendungen mit einem globalen Publikum Sprache hinzu, z. B. RSS-Feeds, Websites oder Videos. Machen Sie Ihre Mobil- und IoT-Anwendungen sprachbereit für die Zukunft.

Mehr über Spracherzeugung erfahren.

Speichern Sie die Sprachausgabe von Amazon Polly und geben Sie sie wieder, um Anrufer mit interaktiven oder automatischen Sprachdialogsystemen zu informieren. Nutzen Sie KI-Funktionen, um Stimmen zu generieren, die Ihre Kundschaft emotional ansprechen.

Weitere Informationen zu Sprach-Engines

Erstellen Sie Voiceover für Animationen, Spiele und andere Medien direkt aus Ihren Skripten. Verwenden Sie SSML, eine W3C-Standard-XML-basierte Markup-Sprache, um Phrasierung, Betonung und Intonation an die jeweilige Szene anzupassen. Passen Sie die Sprachdauer automatisch an, um mehrsprachiges Synchronisieren zu erleichtern.

Mehr über SSML erfahren

Funktionen

Amazon Polly verfügt über eine Vielzahl von Funktionen, darunter einige der unten aufgeführten

Lebensechte Stimmen

Konversationelle Benutzererlebnisse mit gleichbleibend schnellen Reaktionszeiten bieten

Wenn Sie eine Amazon-Polly-Ausgabe anfordern, können Sie aus Dutzenden lebensechter Stimmen und verschiedenen Sprachen wählen. Jede Stimme wird von Muttersprachlern erstellt, wobei es auch innerhalb derselben Sprache Variationen von Stimme zu Stimme gibt. Die meisten Sprachen enthalten eine oder mehrere Männer- und Frauenstimmen, sodass Sie die für Ihren Anwendungsfall am besten geeignete Sprache auswählen können.

A woman wearing a yellow jacket stands outside, smiling while using a pink smartphone near a metal railing and modern structure.

Individuell anpassbare Ausgabe

Sprachausgabe nach Bedarf anpassen und steuern

Mit Amazon Polly können Sie benutzerdefinierte Text-zu-Sprache-Ausgaben erstellen, die die Aufmerksamkeit Ihres Publikums wecken und halten. Verwenden Sie benutzerdefinierte Lexika, um die Aussprache von Akronymen, Firmennamen, interner Terminologie oder anderen Wörtern Ihrer Wahl zu ändern. Mit den Speech Synthesis Markup Languages (SSML)-Tags von Amazon Polly können Sie auch Betonung, Intonation, Phrasierung und Stil anpassen. Generieren Sie eine KI-Sprachausgabe, die am besten zu Ihrem Unternehmen passt.

Two people collaborating at a desk, with one working on code displayed on a laptop and the other pointing to a data visualization of yellow data points on a computer monitor, representing artificial intelligence or machine learning analysis.

Leistung der generativen KI

Zu einem Bruchteil der Kosten auf integrierte Generative-KI-Funktionen zugreifen

Amazon Polly unterstützt mehrere Sprach-Engines, aus denen Sie wählen können, um Text-zu-Sprache zu konvertieren. Die Engine verwendet einen Transformer mit Milliarden Parametern, um Stimmen schrittweise und streambar zu erzeugen. Dieser KI-Sprachgenerator erzeugt synthetische Sprache, die selbstbewusst, emotional engagiert und sehr umgangssprachlich ist, ähnlich einer echten menschlichen Stimme.

People collaborating at a wooden table with laptops, smartphone, potted plant, and a lightbulb lamp, suggesting teamwork and brainstorming in a modern workspace.

Kontrolle und Sicherheit

Sicheres Speichern und Verteilen von Sprache in Standardformaten

Speichern Sie Ihre Text-zu-Sprache-Ausgabe in Standard-Audiodateien wie MP3 und OGG zur Verbreitung, Analyse, Archivierung oder für andere Anwendungsfälle ohne zusätzliche Kosten. Zwischenspeichern Sie Ihre Dateien, um sie bei Bedarf schneller abrufen zu können. Die Sicherheit, das Vertrauen und der Datenschutz Ihrer Inhalte haben für AWS höchste Priorität. Amazon Polly speichert den Inhalt Ihrer Textübermittlungen nicht.

Häufig gestellte Fragen

Ja. Amazon Polly bietet nach Ihrer Anmeldung ein Jahr lang kostenlose Text-zu-Sprache-KI-Services an – bis zu einer Mindestnutzungsschwelle. Der Schwellenwert variiert je nach der von Ihnen ausgewählten Sprach-Engine zwischen 100 000 Zeichen und 5 Millionen Zeichen. Weitere Informationen finden Sie unter Preise für Amazon Polly.

Ab dem 15. Juli 2025 erhalten AWS-Neukunden bis zu 200 USD an Guthaben für kostenloses AWS-Kontingent. Dieses Guthaben kann für berechtigte AWS-Services genutzt werden, auch für Amazon Polly. Im Verlauf der Kontoanmeldung können Sie zwischen einem kostenlosen Paket und einem kostenpflichtigen Paket wählen. Nach der Kontoerstellung ist das kostenlose Paket 6 Monate lang verfügbar. Bei einem Upgrade auf ein kostenpflichtiges Paket wird das ggf. noch vorhandene Guthaben des kostenlosen Kontingents automatisch mit Ihren AWS-Rechnungen verrechnet. Nach Kontoerstellung muss sämtliches Guthaben aus dem kostenlosen Kontingent innerhalb von 12 Monaten verbraucht werden. Weitere Informationen zum Programm der kostenlosen AWS-Kontingente finden Sie auf der Website zum kostenlosen AWS-Kontingent und in der Dokumentation zum kostenlosen AWS-Kontingent.

Amazon Polly bietet über 100 männliche und weibliche Stimmen in über 40 Sprachen und Sprachvarianten. AWS aktualisiert und erweitert unsere Sprachfunktionen ständig.

Amazon Polly produziert MP3-, OGG- und andere Standard-Audiodateiformate, die mit 8 000 Hz, 16 000 Hz und 22 050 Hz gesampelt wurden.

Die Antwort lautet Ja. Derzeit verwendet Alexa die Polly-Technologie, um die Text-zu-Sprache-Generierungslösung voranzutreiben. Die Alexa-Stimmen wurden jedoch exklusiv für Alexa entwickelt und sind nicht extern verfügbar.

Nein. Amazon Polly ist ein vollständig verwalteter Cloud-KI-Service. Sie kommunizieren damit über APIs in Ihrem Code. Sie können den Amazon-Polly-Quellcode nicht herunterladen oder in Ihrer Umgebung bereitstellen. Sie können Amazon Polly jedoch ab Ihrem Start 12 Monate lang kostenlos nutzen (bis zu einem vorab festgelegten Nutzungsgrenzwert). Weitere Informationen finden Sie unter Preise für Amazon Polly.

Ab dem 15. Juli 2025 erhalten AWS-Neukunden bis zu 200 USD an Guthaben für kostenloses AWS-Kontingent. Dieses Guthaben kann für berechtigte AWS-Services genutzt werden, auch für Amazon Polly. Im Verlauf der Kontoanmeldung können Sie zwischen einem kostenlosen Paket und einem kostenpflichtigen Paket wählen. Nach der Kontoerstellung ist das kostenlose Paket 6 Monate lang verfügbar. Bei einem Upgrade auf ein kostenpflichtiges Paket wird das ggf. noch vorhandene Guthaben des kostenlosen Kontingents automatisch mit Ihren AWS-Rechnungen verrechnet. Sämtliches Guthaben aus dem kostenlosen Kontingent muss innerhalb von 12 Monaten nach dem Erstellen des Kontos verbraucht werden. Weitere Informationen zum Programm der kostenlosen AWS-Kontingente finden Sie auf der Website zum kostenlosen AWS-Kontingent und in der Dokumentation zum kostenlosen AWS-Kontingent.