Erste Schritte mit Amazon Polly

Amazon Polly ist ein Service, der Text in natürliche Sprache konvertiert. Mit Amazon Polly erstellen Sie sprachfähige Anwendungen. Damit ist der Weg frei für komplett neue Kategorien sprachgestützter Produkte. Amazon Polly ist ein KI-Service von Amazon KI, der mit Hilfe von Deep Learning-Technologien Sprache synthetisiert, die sich wie eine menschliche Stimme anhört. Amazon Polly beherrscht Dutzende lebensechte Stimmen. Wenn Sie Ihre sprachgestützte Anwendung für internationale Märkte entwickeln, stehen für Sprachen die idealen Stimmen zur Auswahl.

Amazon Polly antwortet kontinuierlich nach kurzer Zeit und meistert so die Voraussetzung für interaktive Echtzeit-Dialoge. Sie können die Sprachausgabe von Amazon Polly für spätere Offline-Wiedergabe oder Weiterverteilung zwischenspeichern und ablegen. Darüber hinaus ist die Nutzung von Amazon Polly sehr einfach. Senden Sie den Text, der in Sprache umgewandelt werden soll, an die API von Amazon Polly. Nachdem Amazon Polly umgehend einen Audiostream zurückgesendet hat, kann dieser von Ihrer Anwendung direkt wiedergegeben oder in einem gängigen Audioformat (z. B. MP3) gespeichert werden.

Bei Amazon Polly zahlen Sie nur für die Anzahl von Zeichen, die Sie in Sprache umwandeln. Sie können die von Polly generierte Sprache dann speichern und erneut abspielen. Die geringen Kosten pro umgewandeltes Zeichen, nicht vorhandene Einschränkungen beim Speichern oder der Wiederverwendung der Sprachausgabe machen Amazon Polly zu einer kostengünstigen Methode zur Aktivierung von Text-to-Speech überall.

Amazon Polly zuhören

Um Videos auf dieser Seite ansehen zu können, ist Adobe Flash Player oder ein anderer, moderner Browser ist erforderlich.

Einführung in Amazon Polly
1:20
Einführung in Amazon Polly: AWS re:Invent 2016

Ankündigung von Speech Marks und Flüstern

Zweiminütige Übersicht über die neuen Speech Marks und Flüstern-Sprachfunktionen in Amazon Polly (April 2017)


Sprache Weiblich Männlich Probentext
Englisch Joanna Joey Guten Tag. Sprechen Sie eine Fremdsprache? Eine Sprache ist niemals genug.
Dänisch Naja Mads Hej. Taler du et fremmed sprog? Et sprog er aldrig nok.
Brasilianisches Portugiesisch Vitória Ricardo Oi. Você fala algum idioma estrangeiro? Somente um idioma nunca é bastante.
Spanisch Penélope Miguel Hola. ¿Hablas algún idioma extranjero? Un solo idioma no es suficiente.
Isländisch Dóra Karl Halló, Hæ talar þú erlent tungumál? Eitt tungumál er aldrei nóg.
Natürlich klingende Stimmen

Natürlich klingende Stimmen

Amazon Polly bietet Dutzende lebensechte Stimmen und unterstützt mehrere Sprachen, einschließlich einer großen Bandbreite an männlichen und weiblichen Stimmen mit einer Vielzahl von Akzenten. Dank der flüssigen Aussprache von Text in verschiedenen Sprache können Sie mit Amazon Polly eine Sprachausgabe von hoher Qualität bereitstellen und Anwendungen für Benutzer weltweit entwickeln.

Einfache Integration

Einfache Integration

Mit Amazon Polly können Sie problemlos Sprachausgabe zu Ihrer Website, mobilen App oder Ihrem Gerät hinzufügen. Mit Amazon Polly schreiben Sie den Text, den Sie in Sprache umwandeln möchten, einfach in die Amazon Polly-API, und Sie erhalten sofort den Audio-Stream. Anders als andere Lösungen, für die ein lang andauernder Genehmigungsprozess erforderlich ist, müssen Sie bei Amazon Polly nicht angeben, in welcher Weise Sie die Sprache von Amazon Polly in Ihren Anwendungen einsetzen möchten, und es sind keine Distributionsverträge zu unterzeichnen. Sie können also sofort anfangen.

Speichern und Umverteilen von Sprache

Speichern und Umverteilen von Sprache

Anders als bei anderen Lösungen, für die eine Lizenzgebühr erforderlich ist oder bei jedem Abspielen eines zuvor erstellten Audio-Streams Kosten anfallen, erlaubt Amazon Polly unbegrenztes Abspielen ohne zusätzliche Gebühren. Dieses kostenlose Abspielen gilt auch für die Offline-Verwendung. Sie können Sprachdateien in verschiedenen Standardformaten wie MP3 und OGG erstellen und diese Dateien auf Geräten wie Mobiltelefonen oder Internet of Things (IoT)-Geräten speichern, um sie offline abzuspielen.

 

Geringe Kosten

Geringe Kosten

Das Preisumlagesystem, die geringen Kosten pro umgewandeltem Zeichen und das unbegrenzte Abspielen macht Amazon Polly zu einer kostengünstigen Methode für Sprachsynthese in praktisch jeder Anwendung.

Schnelle Antwort

Schnelle Antwort

Die Bereitstellung von lebensechten Stimmen und dialogorientierte Benutzererfahrungen erfordern gleichbleibend schnelle Antwortzeiten. Sprachaktivierte Anwendungen müssen synthetisierte Sprache ohne Verzögerungen abspielen. Erwägen Sie Apps mit gesprochenen Anweisungen für Navigations- oder eLearning-Anwendungen, die Sprachanweisungen für Lernende bereitstellen, sowie für Apps, die den Benutzer durch Echtzeit-Dialoge einbeziehen. Diese Apps sind am Effektivsten, wenn Antworten ohne wahrgenommene Verzögerungen im Dialog erfolgen können. Auch wenn Sie längere Texte an die Amazon Polly-API senden, wird die Audio-Antwort als Stream an Ihre Anwendung zurückgegeben, sodass Sie die Sprache sofort abspielen können. Diese Form dynamischer, gesprochener Antworten erfordert den Zugriff auf eine sehr viel größere Anzahl von Audio-Sprachausgaben als normalerweise zum Speichern auf den Geräten eines Benutzers zur Verfügung stehen. Amazon Polly befindet sich in der Cloud, sodass Sie Zugriff auf eine Vielzahl verschiedener synthetisierter Sprachausgaben haben. Mit Amazon Polly kann Ihre Anwendung noch mehr wertvolle Antworten mit Echtzeitdaten bereitstellen.

Mit Amazon Polly können Sie problemlos Sprachausgabe zu Ihrem Video, Ihrer Präsentation oder Ihrem Online-Schulungskurs hinzufügen. Amazon Polly kann Sprachausgaben in 24 Sprachen generieren, sodass es einfach ist, Sprachausgaben zu Anwendungen mit einem globalen Publikum hinzuzufügen. Mit Amazon Polly können Sie Ihre RSS-Feeds, Nachrichten oder E-Mails lesen und synthetisierte Sprache in Form von Audiodateien speichern.

Erstellung von Inhalten
GoAnimate

„Amazon Polly gibt GoAnimate-Benutzern die Möglichkeit, den Zeichen, die sie über unsere Plattform animieren, Sprache zu verleihen. Dies ist besonders nützlich in Szenarios, wo ein Live-Voice-Over entweder aufgrund eingeschränkter Ressourcen oder der Zeit nicht möglich ist, zum Beispiel bei der Entwicklung eines Videos in vielen Sprachen oder im Rahmen der Vorproduktion zur Beschleunigung des Genehmigungsprozesses. Die Sprache wird nahtlos in unseren umfangreichen Satz bereits animierter Assets integriert, was die Benutzerfreundlichkeit von GoAnimate verbessert und unseren Kunden sowohl Leistungsfähigkeit als auch eine schnellere Markteinführung ermöglicht.“

– Alvin Hung, CEO und Gründer von GoAnimate


Amazon Polly ermöglicht Entwicklern die Bereitstellung ihrer Anwendungen mit einer erweiterten visuellen Erfahrung, wie zum Beispiel sprachsynchronisierten Gesichtsanimationen und Worthervorhebungen im Karaoke-Stil. Amazon Polly vereinfacht das Anfordern eines zusätzlichen Metadaten-Streams mit Informationen zur Aussprache bestimmter Sätze, Wörter und Laute. Mithilfe dieses Metadaten-Streams und des Audio-Streams mit synthetisierter Sprache können Kunden Avatare animieren und Text während der Aussprache in ihrer App hervorheben.

Erstellung von Inhalten
Wizkids

"Wir streben danach, den Cloud-basierten Klassenraum für alle Benutzer ansprechender und effektiver zu machen, einschließlich Benutzer mit Lese- und Schreibschwächen. Amazon Polly verbessert unsere Lernplattform durch Integrieren von Text-to-Speech-Stimmen von hoher Qualität in unser AppWriter-Produktpaket. Für unsere Benutzer ist es von zentraler Bedeutung, Text in Echtzeit hervorzuheben, während er laut vorgelesen wird. Mit Speech Marks von Polly kann AppWriter eine erweiterte Leseerfahrung bereitstellen, die das Feld für alle Menschen mit Lese- und Schreibproblemen ebnet."

– Stefan Pal, COO, Wizkids

Mit Amazon Polly können Sie problemlos eine Sprachausgabe zu Ihren mobilen Apps und Games hinzufügen. Mit Amazon Polly können Sie Standard-Sprachantworten auf dem Gerät speichern und auch dynamische Echtzeitantworten wie bei den Spielfiguren-Dialogen in Games, Leaderboard-Ranglisten und Game-Einladungen aktivieren.

Mobile und Desktop-Apps
Washington Post

„Wir wollten unsere mehr als 1 200 täglichen Geschichten und Artikel schon seit langem als Audioversionen anbieten, haben jedoch festgestellt, dass die bisherigen Text-to-Speech-Lösungen angesichts der gelieferten Sprachqualität einfach zu teuer waren. Jetzt freuen wir uns, unseren Lesern mit Amazon Polly und seiner hohen Sprachqualität noch bessere und vielfältigere Möglichkeiten für die Nutzung unserer Inhalte bieten zu können.“

- Joseph Price, Senior Product Manager, The Washington Post


Mit Amazon Polly können Ihre Kundenzentren mit natürlich klingenden Stimmen antworten. Sie können die Sprachausgabe von Amazon Polly über Ihre IVR (Interactive Voice Response)-Systeme abspielen. Zusätzlich können Sie die vorhandene Amazon Polly-API verwenden und automatisierte Echtzeit-Informationen wie den Service-Status, Anfragen zu Konto und Rechnungen, Adressen und Kontaktdaten bereitstellen.

Kundenzentrum

Mit Amazon Polly kann das neue Internet of Things (IoT) genutzt werden, da es einfach und kostengünstig ist, Sprache zu IdD-Geräten hinzuzufügen. IoT-Geräte können Sprache nutzen, um natürliche Antworten und Benachrichtigungen bereitzustellen, sodass die Anwendungen zugänglicher sind und die Benutzer Information erhalten können, ohne auf einen Bildschirm angewiesen zu sei. Mit Amazon Polly können Sie Sprachdateien generieren und diese auf Ihren Geräten speichern, um sie offline abzuspielen.

Erstellen Sie mit AWS Lambda vorsignierte Polly-URLs auf der Grundlage von Ereignissen aus der AWS IoT Rules-Engine, und senden Sie diese URLs dann mit Device Gateway an Ihre IdD-Geräte, damit diese lebensechte Sprache anfordern können.

Internet of Things (IoT)

Mit Amazon Polly kann die Nutzung von Anwendungen zum Erlernen neuer Sprachen verbessert werden. So können Endbenutzer zum Beispiel fremdsprachige Phrasen in Ihre Anwendung eingeben, um sie von einem Muttersprachler gesprochen zu hören. Amazon Polly unterstützt 24 Sprachen und gibt Lehrern und Lernenden somit eine Vielzahl von Möglichkeiten.

Erlernen von Sprachen
Duolingo

„Mir fallen nicht viele Situationen ein, in denen die korrekte Aussprache wichtiger ist als beim Erlernen einer neuen Sprache. Wir haben festgestellt, dass die Stimmen von Amazon Polly nicht nur von hoher Qualität sind, sondern beim Unterrichten einer Sprache mit natürlicher menschlicher Sprache auf einer Stufe stehen.“

– Severin Hacker, CTO, Duolingo


Mit Amazon Polly können Sie zugängliche Informationen in Form von synthetisierter Sprache für sehbehinderte Personen erstellen und vertreiben. Auf diese Weise können Sie Menschen mit Sehbehinderungen dabei unterstützen, unterschiedliche Inhalte wie Nachrichten, Bücher oder E-Mail-Nachrichten zu nutzen.

Royal National Institute of Blind People

„Wir verwenden derzeit die Speech-to-Text-Technologie von Amazon, um zugängliche Informationen in Form von synthetisierten Audio-Inhalten für unsere zahlreichen B2B- und B2C-Kunden zu erstellen und zu vertreiben, einschließlich Versorgungsunternehmen, Finanzinstitute und Medienunternehmen sowie anderes kundenorientiertes Material wie Zeitschriften und Publikationen. Wir freuen uns, mit der Vorstellung von Amazon Polly in der Lage zu sein, noch bessere Erfahrungen für diese Kunden zu ermöglichen, indem wir unglaublich lebensechte Stimmen bieten, die unser Publikum begeistern und mitreißen werden.“

– John Worsfold, Solutions Implementation Manager, Royal National Institute of Blind People

Der Einstieg in Amazon Polly ist ganz einfach. Registrieren Sie sich bei der Konsole, um mit wenigen Klicks mit dem Generieren von Sprache aus Ihren eigenen Texten zu beginnen.

Erste Schritte