Erste Schritte mit Amazon Polly

Amazon Polly ist ein Service, der Text in natürliche Sprache konvertiert. Mit Polly erstellen Sie sprachfähige Anwendungen. Damit ist der Weg frei für komplett neue Kategorien sprachgestützter Produkte. Polly ist ein KI-Service von Amazon KI, der mit Hilfe von Deep Learning-Technologien Sprache synthetisiert, die sich wie eine menschliche Stimme anhört. Polly beherrscht 47 lebensechte Stimmen. Wenn Sie Ihre sprachgestützte Anwendung für internationale Märkte entwickeln, stehen für 24 Sprachen die idealen Stimmen zur Auswahl.

Amazon Polly antwortet kontinuierlich nach kurzer Zeit und meistert so die Voraussetzung für interaktive Echtzeit-Dialoge. Sie können Pollys Sprachausgabe für spätere Offline-Wiedergabe oder Weiterverteilung zwischenspeichern und ablegen. Darüber hinaus ist die Nutzung von Polly sehr einfach. Senden Sie den Text, der in Sprache umgewandelt werden soll, an die API von Polly. Nachdem Polly umgehend einen Audiostream zurückgesendet hat, kann dieser von Ihrer Anwendung direkt wiedergegeben oder in einem gängigen Audioformat (z. B. MP3) gespeichert werden.

Bei Polly zahlen Sie nur für die Anzahl von Zeichen, die Sie in Sprache umwandeln. Sie können die von Polly generierte Sprache dann speichern und erneut abspielen. Die geringen Kosten pro umgewandeltes Zeichen, nicht vorhandene Einschränkungen beim Speichern oder der Wiederverwendung der Sprachausgabe machen Polly zu einer kostengünstigen Methode zur Aktivierung von Text-to-Speech überall.

Einführung in Amazon Polly
1:20
Amazon Polly: AWS re:Invent 2016

Chatten Sie mit Experten und erhalten Sie weitere Informationen zu AWS AI, indem Sie sich für die bevorstehenden Tech Talks registrieren:

 

Sprache Weiblich Männlich Probentext
Englisch Joanna Joey Guten Tag. Sprechen Sie eine Fremdsprache? Eine Sprache ist niemals genug.
Dänisch Naja Mads Hej. Taler du et fremmed sprog? Et sprog er aldrig nok.
Brasilianisches Portugiesisch Vitória Ricardo Oi. Você fala algum idioma estrangeiro? Somente um idioma nunca é bastante.
Spanisch Penélope Miguel Hola. ¿Hablas algún idioma extranjero? Un solo idioma no es suficiente.
Isländisch Dóra Karl Halló, Hæ talar þú erlent tungumál? Eitt tungumál er aldrei nóg.
Natürlich klingende Stimmen

Natürlich klingende Stimmen

Amazon Polly bietet 47 lebensechte Stimmen und unterstützt 24 Sprachen, einschließlich einer großen Bandbreite an männlichen und weiblichen Stimmen mit einer Vielzahl von Akzenten. Dank der flüssigen Aussprache von Text in verschiedenen Sprache können Sie mit Polly eine Sprachausgabe von hoher Qualität bereitstellen und Anwendungen für Benutzer weltweit entwickeln.

Einfache Integration

Einfache Integration

Mit Amazon Polly können Sie problemlos Sprachausgabe zu Ihrer Website, mobilen App oder Ihrem Gerät hinzufügen. Mit Polly schreiben Sie den Text, den Sie in Sprache umwandeln möchten, einfach in die Polly API, und Sie erhalten sofort den Audio-Stream. Anders als andere Lösungen, für die ein lang andauernder Genehmigungsprozess erforderlich ist, müssen Sie bei Polly nicht angeben, in welcher Weise Sie die Sprache von Polly in Ihren Anwendungen einsetzen möchten, und es sind keine Distributionsverträge zu unterzeichnen. Sie können also sofort anfangen.

Speichern und Umverteilen von Sprache

Speichern und Umverteilen von Sprache

Anders als bei anderen Lösungen, für die eine Lizenzgebühr erforderlich ist oder bei jedem Abspielen eines zuvor erstellten Audio-Streams Kosten anfallen, erlaubt Amazon Polly unbegrenztes Abspielen ohne zusätzliche Gebühren. Dieses kostenlose Abspielen gilt auch für die Offline-Verwendung. Sie können Sprachdateien in verschiedenen Standardformaten wie MP3 und OGG erstellen und diese Dateien auf Geräten wie Mobiltelefonen oder Internet of Things (IoT)-Geräten speichern, um sie offline abzuspielen.

 

Geringe Kosten

Geringe Kosten

Das Preisumlagesystem, die geringen Kosten pro umgewandeltem Zeichen und das unbegrenzte Abspielen macht Amazon Polly zu einer kostengünstigen Methode für Sprachsynthese in praktisch jeder Anwendung.

Schnelle Antwort

Schnelle Antwort

Die Bereitstellung von lebensechten Stimmen und dialogorientierte Benutzererfahrungen erfordern gleichbleibend schnelle Antwortzeiten. Sprachaktivierte Anwendungen müssen synthetisierte Sprache ohne Verzögerungen abspielen. Erwägen Sie Apps mit gesprochenen Anweisungen für Navigations- oder eLearning-Anwendungen, die Sprachanweisungen für Lernende bereitstellen, sowie für Apps, die den Benutzer durch Echtzeit-Dialoge einbeziehen. Diese Apps sind am Effektivsten, wenn Antworten ohne wahrgenommene Verzögerungen im Dialog erfolgen können. Auch wenn Sie längere Texte an die Polly-API senden, wird die Audio-Antwort als Stream an Ihre Anwendung zurückgegeben, sodass Sie die Sprache sofort abspielen können. Diese Form dynamischer, gesprochener Antworten erfordert den Zugriff auf eine sehr viel größere Anzahl von Audio-Sprachausgaben als normalerweise zum Speichern auf den Geräten eines Benutzers zur Verfügung stehen. Amazon Polly befindet sich in der Cloud, sodass Sie Zugriff auf eine Vielzahl verschiedener synthetisierter Sprachausgaben haben. Mit Polly kann Ihre Anwendung noch mehr wertvolle Antworten mit Echtzeitdaten bereitstellen.

Mit Amazon Polly können Sie problemlos Sprachausgabe zu Ihrem Video, Ihrer Präsentation oder Ihrem Online-Schulungskurs hinzufügen. Polly kann Sprachausgaben in 24 Sprachen generieren, sodass es einfach ist, Sprachausgaben zu Anwendungen mit einem globalen Publikum hinzuzufügen. Mit Polly können Sie Ihre RSS-Feeds, Nachrichten oder E-Mails lesen und synthetisierte Sprache in Form von Audiodateien speichern.

Erstellung von Inhalten
GoAnimate

„Amazon Polly gibt GoAnimate-Benutzern die Möglichkeit, den Zeichen, die sie über unsere Plattform animieren, Sprache zu verleihen. Dies ist besonders nützlich in Szenarios, wo ein Live-Voice-Over entweder aufgrund eingeschränkter Ressourcen oder der Zeit nicht möglich ist, zum Beispiel bei der Entwicklung eines Videos in vielen Sprachen oder im Rahmen der Vorproduktion zur Beschleunigung des Genehmigungsprozesses. Die Sprache wird nahtlos in unseren umfangreichen Satz bereits animierter Assets integriert, was die Benutzerfreundlichkeit von GoAnimate verbessert und unseren Kunden sowohl Leistungsfähigkeit als auch eine schnellere Markteinführung ermöglicht.“

– Alvin Hung, CEO und Gründer von GoAnimate


Mit Amazon Polly können Ihre Kundenzentren mit natürlich klingenden Stimmen antworten. Sie können die Sprachausgabe von Polly über Ihre IVR (Interactive Voice Response)-Systeme abspielen. Zusätzlich können Sie die vorhandene Polly-API verwenden und automatiserte Echtzeit-Informationen wie den Service-Status, Anfragen zu Konto und Rechnungen, Adressen und Kontaktdaten bereitstellen.

Kundenzentrum

Mit Amazon Polly kann das neue Internet of Things (IoT) genutzt werden, da es einfach und kostengünstig ist, Sprache zu IdD-Geräten hinzuzufügen. IoT-Geräte können Sprache nutzen, um natürliche Antworten und Benachrichtigungen bereitzustellen, sodass die Anwendungen zugänglicher sind und die Benutzer Information erhalten können, ohne auf einen Bildschirm angewiesen zu sei. Mit Polly können Sie Sprachdateien generieren und diese auf Ihren Geräten speichern, um sie offline abzuspielen.

Erstellen Sie mit AWS Lambda vorsignierte Polly-URLs auf der Grundlage von Ereignissen aus der AWS IoT Rules-Engine, und senden Sie diese URLs dann mit Device Gateway an Ihre IdD-Geräte, damit diese lebensechte Sprache anfordern können.

Internet of Things (IoT)

Mit Amazon Polly kann die Nutzung von Anwendungen zum Erlernen neuer Sprachen verbessert werden. So können Endbenutzer zum Beispiel fremdsprachige Phrasen in Ihre Anwendung eingeben, um sie von einem Muttersprachler gesprochen zu hören. Polly unterstützt 24 Sprachen und gibt Lehrern und Lernenden somit eine Vielzahl von Möglichkeiten.

Erlernen von Sprachen
Duolingo

„Mir fallen nicht viele Situationen ein, in denen die korrekte Aussprache wichtiger ist als beim Erlernen einer neuen Sprache. Wir haben festgestellt, dass die Stimmen von Amazon Polly nicht nur von hoher Qualität sind, sondern beim Unterrichten einer Sprache mit natürlicher menschlicher Sprache auf einer Stufe stehen.“

– Severin Hacker, CTO, Duolingo


Mit Amazon Polly können Sie problemlos eine Sprachausgabe zu Ihren mobilen Apps und Games hinzufügen. Mit Polly können Sie Standard-Sprachantworten auf dem Gerät speichern und auch dynamische Echtzeitantworten wie bei den Spielfiguren-Dialogen in Games, Leaderboard-Ranglisten und Game-Einladungen aktivieren.

Mobile und Desktop-Apps
Wizkids

„Wir streben danach, den Cloud-basierten Klassenraum für alle Benutzer ansprechender und effektiver zu machen, einschließlich Benutzer mit Lese- und Schreibschwächen. Amazon Polly verbessert unsere Lernplattform durch Integrieren von Text-to-Speech-Stimmen von hoher Qualität in unser AppWriter-Produktpaket.“

– Stefan Pal, COO, Wizkids


Mit Amazon Polly können Sie zugängliche Informationen in Form von synthetisierter Sprache für sehbehinderte Personen erstellen und vertreiben. Auf diese Weise können Sie Menschen mit Sehbehinderungen dabei unterstützen, unterschiedliche Inhalte wie Nachrichten, Bücher oder E-Mail-Nachrichten zu nutzen.

Royal National Institute of Blind People

„Wir verwenden derzeit die Speech-to-Text-Technologie von Amazon, um zugängliche Informationen in Form von synthetisierten Audio-Inhalten für unsere zahlreichen B2B- und B2C-Kunden zu erstellen und zu vertreiben, einschließlich Versorgungsunternehmen, Finanzinstitute und Medienunternehmen sowie anderes kundenorientiertes Material wie Zeitschriften und Publikationen. Wir freuen uns, mit der Vorstellung von Amazon Polly in der Lage zu sein, noch bessere Erfahrungen für diese Kunden zu ermöglichen, indem wir unglaublich lebensechte Stimmen bieten, die unser Publikum begeistern und mitreißen werden.“

– John Worsfold, Solutions Implementation Manager, Royal National Institute of Blind People

Der Einstieg in Polly ist ganz einfach. Registrieren Sie sich bei der Konsole, um mit wenigen Klicks mit dem Generieren von Sprache aus Ihren eigenen Texten zu beginnen.

Erste Schritte