Erste Schritte mit Amazon Polly

Amazon Polly ist ein Service, der Text in realistische Sprachausgabe verwandelt, sodass Sie sprechende Anwendungen und ganz neue Kategorien sprachfähiger Produkte entwickeln können. Amazon Polly ist ein Text-zu-Sprache-Service, der mit Hilfe von Deep Learning-Technologien Sprache synthetisiert, die sich wie eine menschliche Stimme anhört.

Amazon Polly beherrscht Dutzende lebensechte Stimmen. Wenn Sie Ihre sprachgestützte Anwendung für internationale Märkte entwickeln, stehen für Sprachen die idealen Stimmen zur Auswahl.

Sprache Weiblich Männlich Probentext
Englisch Joanna Matthew Guten Tag. Sprechen Sie eine Fremdsprache? Eine Sprache ist niemals genug.
Dänisch Naja Mads Hej. Taler du et fremmed sprog? Et sprog er aldrig nok.
Brasilianisches Portugiesisch Vitória Ricardo Oi. Você fala algum idioma estrangeiro? Somente um idioma nunca é bastante.
Spanisch Penélope Miguel Hola. ¿Hablas algún idioma extranjero? Un solo idioma no es suficiente.
Japanisch Mizuki
Takumi こんにちは、外国語を話せますか? 世界にはたくさんの言語があります。
Koreanisch Seoyeon   안녕하세요? 외국어를 구사하십니까? 이 세상에는 수많은 언어들이 있답니다。

Eine vollständige Liste der Amazon Polly-Stimmen und der unterstützten Sprachen finden Sie hier.


Datum

Titel

Autor

9. November 2017 Modify the Timbre of Amazon Polly Voices with the New Vocal Tract SSML Feature Robin Dautricourt, Sr. Product Manager, Amazon Polly

19. Oktober 2017

Convert Your Text into an MP3 File with Amazon Polly and a Simple Python Script Dzidas Martinaitis, Data Scientist, AWS

12. Oktober 2017

Amazon Polly Expands to the Asia Pacific (Tokyo) Region and Adds Two New Voices Robin Dautricourt, Sr. Product Manager, Amazon Polly

29. September 2017

Using Amazon Polly to Provide Real-Time Home Monitoring Alerts Siva K. Syamala, Sr. Developer, Y-Cam Solutions
30. August 2017 How Amazon Polly Breathed Life into Dan Brown’s Digital Assistant Damian Dutton, CEO und Gründer, Beeliked

Hier finden Sie alle KI-Blog-Beiträge zu Amazon Polly.


Natürlich klingende Stimmen

Natürlich klingende Stimmen

Amazon Polly bietet Dutzende lebensechte Stimmen und unterstützt mehrere Sprachen, einschließlich einer großen Bandbreite an männlichen und weiblichen Stimmen mit einer Vielzahl von Akzenten. Dank der flüssigen Aussprache von Text in verschiedenen Sprache können Sie mit Amazon Polly eine Sprachausgabe von hoher Qualität bereitstellen und Anwendungen für Benutzer weltweit entwickeln.

Einfache Integration

Einfache Integration

Mit Amazon Polly können Sie problemlos Sprachausgabe zu Ihrer Website, mobilen App oder Ihrem Gerät hinzufügen. Mit Amazon Polly schreiben Sie den Text, den Sie in Sprache umwandeln möchten, einfach in die Amazon Polly-API, und Sie erhalten sofort den Audio-Stream. Anders als andere Lösungen, für die ein lang andauernder Genehmigungsprozess erforderlich ist, müssen Sie bei Amazon Polly nicht angeben, in welcher Weise Sie die Sprache von Amazon Polly in Ihren Anwendungen einsetzen möchten, und es sind keine Distributionsverträge zu unterzeichnen. Sie können also sofort anfangen.

Speichern und Umverteilen von Sprache

Speichern und Umverteilen von Sprache

Anders als bei anderen Lösungen, für die eine Lizenzgebühr erforderlich ist oder bei jedem Abspielen eines zuvor erstellten Audio-Streams Kosten anfallen, erlaubt Amazon Polly unbegrenztes Abspielen ohne zusätzliche Gebühren. Dieses kostenlose Abspielen gilt auch für die Offline-Verwendung. Sie können Sprachdateien in verschiedenen Standardformaten wie MP3 und OGG erstellen und diese Dateien auf Geräten wie Mobiltelefonen oder Internet of Things (IoT)-Geräten speichern, um sie offline abzuspielen.

 

Geringe Kosten

Geringe Kosten

Das Preisumlagesystem, die geringen Kosten pro umgewandeltem Zeichen und das unbegrenzte Abspielen macht Amazon Polly zu einer kostengünstigen Methode für Sprachsynthese in praktisch jeder Anwendung.

Schnelle Antwort

Schnelle Antwort

Die Bereitstellung von lebensechten Stimmen und dialogorientierte Benutzererfahrungen erfordern gleichbleibend schnelle Antwortzeiten. Sprachaktivierte Anwendungen müssen synthetisierte Sprache ohne Verzögerungen abspielen. Erwägen Sie Apps mit gesprochenen Anweisungen für Navigations- oder eLearning-Anwendungen, die Sprachanweisungen für Lernende bereitstellen, sowie für Apps, die den Benutzer durch Echtzeit-Dialoge einbeziehen. Diese Apps sind am Effektivsten, wenn Antworten ohne wahrgenommene Verzögerungen im Dialog erfolgen können. Auch wenn Sie längere Texte an die Amazon Polly-API senden, wird die Audio-Antwort als Stream an Ihre Anwendung zurückgegeben, sodass Sie die Sprache sofort abspielen können. Diese Form dynamischer, gesprochener Antworten erfordert den Zugriff auf eine sehr viel größere Anzahl von Audio-Sprachausgaben als normalerweise zum Speichern auf den Geräten eines Benutzers zur Verfügung stehen. Amazon Polly befindet sich in der Cloud, sodass Sie Zugriff auf eine Vielzahl verschiedener synthetisierter Sprachausgaben haben. Mit Amazon Polly kann Ihre Anwendung noch mehr wertvolle Antworten mit Echtzeitdaten bereitstellen.

Mit Amazon Polly können Sie problemlos Sprachausgabe zu Ihrem Video, Ihrer Präsentation oder Ihrem Online-Schulungskurs hinzufügen. Amazon Polly kann Sprachausgaben in 24 Sprachen generieren, sodass es einfach ist, Sprachausgaben zu Anwendungen mit einem globalen Publikum hinzuzufügen. Mit Amazon Polly können Sie Ihre RSS-Feeds, Nachrichten oder E-Mails lesen und synthetisierte Sprache in Form von Audiodateien speichern.

Erstellung von Inhalten
GoAnimate

„Amazon Polly gibt GoAnimate-Benutzern die Möglichkeit, den Zeichen, die sie über unsere Plattform animieren, Sprache zu verleihen. Dies ist besonders nützlich in Szenarios, wo ein Live-Voice-Over entweder aufgrund eingeschränkter Ressourcen oder der Zeit nicht möglich ist, zum Beispiel bei der Entwicklung eines Videos in vielen Sprachen oder im Rahmen der Vorproduktion zur Beschleunigung des Genehmigungsprozesses. Die Sprache wird nahtlos in unseren umfangreichen Satz bereits animierter Assets integriert, was die Benutzerfreundlichkeit von GoAnimate verbessert und unseren Kunden sowohl Leistungsfähigkeit als auch eine schnellere Markteinführung ermöglicht.“

– Alvin Hung, CEO und Gründer von GoAnimate


Amazon Polly ermöglicht Entwicklern die Bereitstellung ihrer Anwendungen mit einer erweiterten visuellen Erfahrung, wie zum Beispiel sprachsynchronisierten Gesichtsanimationen und Worthervorhebungen im Karaoke-Stil. Amazon Polly vereinfacht das Anfordern eines zusätzlichen Metadaten-Streams mit Informationen zur Aussprache bestimmter Sätze, Wörter und Laute. Mithilfe dieses Metadaten-Streams und des Audio-Streams mit synthetisierter Sprache können Kunden Avatare animieren und Text während der Aussprache in ihrer App hervorheben.

Erstellung von Inhalten

"Wir streben danach, den Cloud-basierten Klassenraum für alle Benutzer ansprechender und effektiver zu machen, einschließlich Benutzer mit Lese- und Schreibschwächen. Amazon Polly verbessert unsere Lernplattform durch Integrieren von Text-to-Speech-Stimmen von hoher Qualität in unser AppWriter-Produktpaket. Für unsere Benutzer ist es von zentraler Bedeutung, Text in Echtzeit hervorzuheben, während er laut vorgelesen wird. Mit Speech Marks von Polly kann AppWriter eine erweiterte Leseerfahrung bereitstellen, die das Feld für alle Menschen mit Lese- und Schreibproblemen ebnet."

– Stefan Pal, COO, Wizkids


Mit Amazon Polly können Ihre Kundenzentren mit natürlich klingenden Stimmen antworten. Sie können die Sprachausgabe von Amazon Polly über Ihre IVR (Interactive Voice Response)-Systeme abspielen. Zusätzlich können Sie die vorhandene Amazon Polly-API verwenden und automatisierte Echtzeit-Informationen wie den Service-Status, Anfragen zu Konto und Rechnungen, Adressen und Kontaktdaten bereitstellen.

Kundenzentrum

"Bandwidth erstellte eine kleine, zuverlässige und schnelle TTS-Anwendung, die von Amazon Polly unterstützt wird. Wir verwenden nur hochwertige Stimmen zu niedrigen Preisen. Der Aufwand für Entwickler, diesen neuen Service zu erstellen, war überraschend gering."

– Yiannis Philipopoulos, Sr. Software Developer, Bandbreite


Mit Amazon Polly kann das neue Internet of Things (IoT) genutzt werden, da es einfach und kostengünstig ist, Sprache zu IdD-Geräten hinzuzufügen. IoT-Geräte können Sprache nutzen, um natürliche Antworten und Benachrichtigungen bereitzustellen, sodass die Anwendungen zugänglicher sind und die Benutzer Information erhalten können, ohne auf einen Bildschirm angewiesen zu sei. Mit Amazon Polly können Sie Sprachdateien generieren und diese auf Ihren Geräten speichern, um sie offline abzuspielen.

Erstellen Sie mit AWS Lambda vorsignierte Polly-URLs auf der Grundlage von Ereignissen aus der AWS IoT Rules-Engine, und senden Sie diese URLs dann mit Device Gateway an Ihre IdD-Geräte, damit diese lebensechte Sprache anfordern können.

Internet of Things (IoT)

"Unsere Recherchen zeigen, dass Kunden heute viel seltener eine sprachgestützte intelligente Sicherheitslösung kaufen, wenn die Stimme roboterhaft klingt, so wie die Stimmen vieler anderer Anbieter als AWS. Unsere Kunden sind vom Klang der Amazon Polly-Stimme begeistert. Tatsächlich denken viele, dass eine reale Person spricht."

– Devin Chawda, CEO, Y-Cam Solutions 


Mit Amazon Polly kann die Nutzung von Anwendungen zum Erlernen neuer Sprachen verbessert werden. So können Endbenutzer zum Beispiel fremdsprachige Phrasen in Ihre Anwendung eingeben, um sie von einem Muttersprachler gesprochen zu hören. Amazon Polly unterstützt 24 Sprachen und gibt Lehrern und Lernenden somit eine Vielzahl von Möglichkeiten.

Erlernen von Sprachen
Duolingo

„Mir fallen nicht viele Situationen ein, in denen die korrekte Aussprache wichtiger ist als beim Erlernen einer neuen Sprache. Wir haben festgestellt, dass die Stimmen von Amazon Polly nicht nur von hoher Qualität sind, sondern beim Unterrichten einer Sprache mit natürlicher menschlicher Sprache auf einer Stufe stehen.“

– Severin Hacker, CTO, Duolingo


Mit Amazon Polly können Sie zugängliche Informationen in Form von synthetisierter Sprache für sehbehinderte Personen erstellen und vertreiben. Auf diese Weise können Sie Menschen mit Sehbehinderungen dabei unterstützen, unterschiedliche Inhalte wie Nachrichten, Bücher oder E-Mail-Nachrichten zu nutzen.

Royal National Institute of Blind People

„Wir verwenden derzeit die Speech-to-Text-Technologie von Amazon, um zugängliche Informationen in Form von synthetisierten Audio-Inhalten für unsere zahlreichen B2B- und B2C-Kunden zu erstellen und zu vertreiben, einschließlich Versorgungsunternehmen, Finanzinstitute und Medienunternehmen sowie anderes kundenorientiertes Material wie Zeitschriften und Publikationen. Wir freuen uns, mit der Vorstellung von Amazon Polly in der Lage zu sein, noch bessere Erfahrungen für diese Kunden zu ermöglichen, indem wir unglaublich lebensechte Stimmen bieten, die unser Publikum begeistern und mitreißen werden.“

– John Worsfold, Solutions Implementation Manager, Royal National Institute of Blind People

Der Einstieg in Amazon Polly ist ganz einfach. Registrieren Sie sich bei der Konsole, um mit wenigen Klicks mit dem Generieren von Sprache aus Ihren eigenen Texten zu beginnen.

Erste Schritte