Erste Schritte mit Amazon Polly

Amazon Polly ist ein Service, der Text in realistische Sprachausgabe verwandelt, sodass Sie sprechende Anwendungen und ganz neue Kategorien sprachfähiger Produkte entwickeln können. Amazon Polly ist ein Text-zu-Sprache-Service, der mit Hilfe von Deep Learning-Technologien Sprache synthetisiert, die sich wie eine menschliche Stimme anhört.

Amazon Polly beherrscht Dutzende lebensechte Stimmen. Wenn Sie Ihre sprachgestützte Anwendung für internationale Märkte entwickeln, stehen für Sprachen die idealen Stimmen zur Auswahl.

Sprache Weiblich Männlich Probentext
Englisch Joanna Matthew Guten Tag. Sprechen Sie eine Fremdsprache? Eine Sprache ist niemals genug.
Dänisch Naja Mads Hej. Taler du et fremmed sprog? Et sprog er aldrig nok.
Brasilianisches Portugiesisch Vitória Ricardo Oi. Você fala algum idioma estrangeiro? Somente um idioma nunca é bastante.
Spanisch Penélope Miguel Hola. ¿Hablas algún idioma extranjero? Un solo idioma no es suficiente.
Isländisch Dóra Karl Halló, Hæ talar þú erlent tungumál? Eitt tungumál er aldrei nóg.
Japanisch Mizuki
Takumi こんにちは、外国語を話せますか? 世界にはたくさんの言語があります。

Eine vollständige Liste der Amazon Polly-Stimmen und der unterstützten Sprachen finden Sie hier.


Datum

Titel

Autor

30. Aug. 2017 Wie Amazon Polly dem digitalen Assistenten von Dan Brown Leben einhauchte Damian Dutton, CEO und Gründer, Beeliked

19. Juli 2017

Erstellen eines zuverlässigen Text-zu-Sprache-Service mit Amazon Polly

Yiannis Philipopoulos, Softwareentwickler, Bandwidth

30. Juni 2017

Verwenden von Amazon Polly zum Bereitstellen der Gesundheitsversorgung für Personen mit Langzeiterkrankungen

Michael Wray, Sr. Software Architect, Inhealthcare

12. Mai 2017

Fördern beim Sprachenlernen auf Duolingo mit Amazon Polly

André Kenji Horie, Software Engineer, Duolingo

5. Mai 2017

Create Audiobooks with Amazon Polly and AWS Batch

Matthew McClean, AWS Partner Solution Architect

Hier finden Sie alle KI-Blog-Beiträge zu Amazon Polly.


Natürlich klingende Stimmen

Natürlich klingende Stimmen

Amazon Polly bietet Dutzende lebensechte Stimmen und unterstützt mehrere Sprachen, einschließlich einer großen Bandbreite an männlichen und weiblichen Stimmen mit einer Vielzahl von Akzenten. Dank der flüssigen Aussprache von Text in verschiedenen Sprache können Sie mit Amazon Polly eine Sprachausgabe von hoher Qualität bereitstellen und Anwendungen für Benutzer weltweit entwickeln.

Einfache Integration

Einfache Integration

Mit Amazon Polly können Sie problemlos Sprachausgabe zu Ihrer Website, mobilen App oder Ihrem Gerät hinzufügen. Mit Amazon Polly schreiben Sie den Text, den Sie in Sprache umwandeln möchten, einfach in die Amazon Polly-API, und Sie erhalten sofort den Audio-Stream. Anders als andere Lösungen, für die ein lang andauernder Genehmigungsprozess erforderlich ist, müssen Sie bei Amazon Polly nicht angeben, in welcher Weise Sie die Sprache von Amazon Polly in Ihren Anwendungen einsetzen möchten, und es sind keine Distributionsverträge zu unterzeichnen. Sie können also sofort anfangen.

Speichern und Umverteilen von Sprache

Speichern und Umverteilen von Sprache

Anders als bei anderen Lösungen, für die eine Lizenzgebühr erforderlich ist oder bei jedem Abspielen eines zuvor erstellten Audio-Streams Kosten anfallen, erlaubt Amazon Polly unbegrenztes Abspielen ohne zusätzliche Gebühren. Dieses kostenlose Abspielen gilt auch für die Offline-Verwendung. Sie können Sprachdateien in verschiedenen Standardformaten wie MP3 und OGG erstellen und diese Dateien auf Geräten wie Mobiltelefonen oder Internet of Things (IoT)-Geräten speichern, um sie offline abzuspielen.

 

Geringe Kosten

Geringe Kosten

Das Preisumlagesystem, die geringen Kosten pro umgewandeltem Zeichen und das unbegrenzte Abspielen macht Amazon Polly zu einer kostengünstigen Methode für Sprachsynthese in praktisch jeder Anwendung.

Schnelle Antwort

Schnelle Antwort

Die Bereitstellung von lebensechten Stimmen und dialogorientierte Benutzererfahrungen erfordern gleichbleibend schnelle Antwortzeiten. Sprachaktivierte Anwendungen müssen synthetisierte Sprache ohne Verzögerungen abspielen. Erwägen Sie Apps mit gesprochenen Anweisungen für Navigations- oder eLearning-Anwendungen, die Sprachanweisungen für Lernende bereitstellen, sowie für Apps, die den Benutzer durch Echtzeit-Dialoge einbeziehen. Diese Apps sind am Effektivsten, wenn Antworten ohne wahrgenommene Verzögerungen im Dialog erfolgen können. Auch wenn Sie längere Texte an die Amazon Polly-API senden, wird die Audio-Antwort als Stream an Ihre Anwendung zurückgegeben, sodass Sie die Sprache sofort abspielen können. Diese Form dynamischer, gesprochener Antworten erfordert den Zugriff auf eine sehr viel größere Anzahl von Audio-Sprachausgaben als normalerweise zum Speichern auf den Geräten eines Benutzers zur Verfügung stehen. Amazon Polly befindet sich in der Cloud, sodass Sie Zugriff auf eine Vielzahl verschiedener synthetisierter Sprachausgaben haben. Mit Amazon Polly kann Ihre Anwendung noch mehr wertvolle Antworten mit Echtzeitdaten bereitstellen.

Mit Amazon Polly können Sie problemlos Sprachausgabe zu Ihrem Video, Ihrer Präsentation oder Ihrem Online-Schulungskurs hinzufügen. Amazon Polly kann Sprachausgaben in 24 Sprachen generieren, sodass es einfach ist, Sprachausgaben zu Anwendungen mit einem globalen Publikum hinzuzufügen. Mit Amazon Polly können Sie Ihre RSS-Feeds, Nachrichten oder E-Mails lesen und synthetisierte Sprache in Form von Audiodateien speichern.

Erstellung von Inhalten
GoAnimate

„Amazon Polly gibt GoAnimate-Benutzern die Möglichkeit, den Zeichen, die sie über unsere Plattform animieren, Sprache zu verleihen. Dies ist besonders nützlich in Szenarios, wo ein Live-Voice-Over entweder aufgrund eingeschränkter Ressourcen oder der Zeit nicht möglich ist, zum Beispiel bei der Entwicklung eines Videos in vielen Sprachen oder im Rahmen der Vorproduktion zur Beschleunigung des Genehmigungsprozesses. Die Sprache wird nahtlos in unseren umfangreichen Satz bereits animierter Assets integriert, was die Benutzerfreundlichkeit von GoAnimate verbessert und unseren Kunden sowohl Leistungsfähigkeit als auch eine schnellere Markteinführung ermöglicht.“

– Alvin Hung, CEO und Gründer von GoAnimate


Amazon Polly ermöglicht Entwicklern die Bereitstellung ihrer Anwendungen mit einer erweiterten visuellen Erfahrung, wie zum Beispiel sprachsynchronisierten Gesichtsanimationen und Worthervorhebungen im Karaoke-Stil. Amazon Polly vereinfacht das Anfordern eines zusätzlichen Metadaten-Streams mit Informationen zur Aussprache bestimmter Sätze, Wörter und Laute. Mithilfe dieses Metadaten-Streams und des Audio-Streams mit synthetisierter Sprache können Kunden Avatare animieren und Text während der Aussprache in ihrer App hervorheben.

Erstellung von Inhalten
Wizkids

"Wir streben danach, den Cloud-basierten Klassenraum für alle Benutzer ansprechender und effektiver zu machen, einschließlich Benutzer mit Lese- und Schreibschwächen. Amazon Polly verbessert unsere Lernplattform durch Integrieren von Text-to-Speech-Stimmen von hoher Qualität in unser AppWriter-Produktpaket. Für unsere Benutzer ist es von zentraler Bedeutung, Text in Echtzeit hervorzuheben, während er laut vorgelesen wird. Mit Speech Marks von Polly kann AppWriter eine erweiterte Leseerfahrung bereitstellen, die das Feld für alle Menschen mit Lese- und Schreibproblemen ebnet."

– Stefan Pal, COO, Wizkids

Mit Amazon Polly können Sie problemlos eine Sprachausgabe zu Ihren mobilen Apps und Games hinzufügen. Mit Amazon Polly können Sie Standard-Sprachantworten auf dem Gerät speichern und auch dynamische Echtzeitantworten wie bei den Spielfiguren-Dialogen in Games, Leaderboard-Ranglisten und Game-Einladungen aktivieren.

Mobile und Desktop-Apps
Washington Post

„Wir wollten unsere mehr als 1 200 täglichen Geschichten und Artikel schon seit langem als Audioversionen anbieten, haben jedoch festgestellt, dass die bisherigen Text-to-Speech-Lösungen angesichts der gelieferten Sprachqualität einfach zu teuer waren. Jetzt freuen wir uns, unseren Lesern mit Amazon Polly und seiner hohen Sprachqualität noch bessere und vielfältigere Möglichkeiten für die Nutzung unserer Inhalte bieten zu können.“

- Joseph Price, Senior Product Manager, The Washington Post


Mit Amazon Polly können Ihre Kundenzentren mit natürlich klingenden Stimmen antworten. Sie können die Sprachausgabe von Amazon Polly über Ihre IVR (Interactive Voice Response)-Systeme abspielen. Zusätzlich können Sie die vorhandene Amazon Polly-API verwenden und automatisierte Echtzeit-Informationen wie den Service-Status, Anfragen zu Konto und Rechnungen, Adressen und Kontaktdaten bereitstellen.

Kundenzentrum

Mit Amazon Polly kann das neue Internet of Things (IoT) genutzt werden, da es einfach und kostengünstig ist, Sprache zu IdD-Geräten hinzuzufügen. IoT-Geräte können Sprache nutzen, um natürliche Antworten und Benachrichtigungen bereitzustellen, sodass die Anwendungen zugänglicher sind und die Benutzer Information erhalten können, ohne auf einen Bildschirm angewiesen zu sei. Mit Amazon Polly können Sie Sprachdateien generieren und diese auf Ihren Geräten speichern, um sie offline abzuspielen.

Erstellen Sie mit AWS Lambda vorsignierte Polly-URLs auf der Grundlage von Ereignissen aus der AWS IoT Rules-Engine, und senden Sie diese URLs dann mit Device Gateway an Ihre IdD-Geräte, damit diese lebensechte Sprache anfordern können.

Internet of Things (IoT)

Mit Amazon Polly kann die Nutzung von Anwendungen zum Erlernen neuer Sprachen verbessert werden. So können Endbenutzer zum Beispiel fremdsprachige Phrasen in Ihre Anwendung eingeben, um sie von einem Muttersprachler gesprochen zu hören. Amazon Polly unterstützt 24 Sprachen und gibt Lehrern und Lernenden somit eine Vielzahl von Möglichkeiten.

Erlernen von Sprachen
Duolingo

„Mir fallen nicht viele Situationen ein, in denen die korrekte Aussprache wichtiger ist als beim Erlernen einer neuen Sprache. Wir haben festgestellt, dass die Stimmen von Amazon Polly nicht nur von hoher Qualität sind, sondern beim Unterrichten einer Sprache mit natürlicher menschlicher Sprache auf einer Stufe stehen.“

– Severin Hacker, CTO, Duolingo


Mit Amazon Polly können Sie zugängliche Informationen in Form von synthetisierter Sprache für sehbehinderte Personen erstellen und vertreiben. Auf diese Weise können Sie Menschen mit Sehbehinderungen dabei unterstützen, unterschiedliche Inhalte wie Nachrichten, Bücher oder E-Mail-Nachrichten zu nutzen.

Royal National Institute of Blind People

„Wir verwenden derzeit die Speech-to-Text-Technologie von Amazon, um zugängliche Informationen in Form von synthetisierten Audio-Inhalten für unsere zahlreichen B2B- und B2C-Kunden zu erstellen und zu vertreiben, einschließlich Versorgungsunternehmen, Finanzinstitute und Medienunternehmen sowie anderes kundenorientiertes Material wie Zeitschriften und Publikationen. Wir freuen uns, mit der Vorstellung von Amazon Polly in der Lage zu sein, noch bessere Erfahrungen für diese Kunden zu ermöglichen, indem wir unglaublich lebensechte Stimmen bieten, die unser Publikum begeistern und mitreißen werden.“

– John Worsfold, Solutions Implementation Manager, Royal National Institute of Blind People

Der Einstieg in Amazon Polly ist ganz einfach. Registrieren Sie sich bei der Konsole, um mit wenigen Klicks mit dem Generieren von Sprache aus Ihren eigenen Texten zu beginnen.

Erste Schritte