Amazon Transcribe

Automatische Spracherkennung

Amazon Transcribe ist ein automatischer Spracherkennungsservice (ASR), der es Entwicklern leicht macht, ihren Anwendungen Sprach- und Textfunktionen hinzuzufügen. Mit der Amazon Transcribe API können Sie in Amazon S3 gespeicherte Audiodateien analysieren, und der Service gibt dann eine Textdatei der transkribierten Sprache zurück.

Amazon Transcribe kann für viele gängige Anwendungen verwendet werden, einschließlich der Transkription von Anrufen beim Kundenservice und dem Generieren von Untertiteln für Audio- und Videoinhalte. Der Service kann Audiodateien in den gängigsten Formaten wie WAV und MP3 mit Zeitstempeln für jedes Wort transkribieren, sodass Sie die Audiokomponenten einfach durch Suchen nach dem Text in der Originalquelle finden können. Amazon Transcribe lernt fortlaufend dazu und verbessert sich, um der Sprachentwicklung zu folgen.

AWS re:Invent 2017 – Vorstellung von Amazon Transcribe

Wichtigste Funktionen

Leicht lesbare Transkriptionen

Die meisten Spracherkennungssysteme geben eine Textfolge ohne Zeichensetzung aus. Amazon Transcribe verwendet tiefes Lernen, um Zeichensetzung und Formatierung automatisch einzufügen, sodass die Ausgabe leichter lesbar ist und ohne weiter Bearbeitung verwendet werden kann.

Unterstützung für Telephony Audio

Aufgezeichnete Audiokomponenten aus Telefongesprächen sind normalerweise von geringer Qualität. Amazon Transcribe wurde speziell entwickelt, um eine große Genauigkeit bei der Verarbeitung von Audiokomponenten in Telefonqualität zu ermöglichen, um Anwendungsfälle wie die Transkription von Kundenservice-Anrufen zu ermöglichen.  

Mehrere Sprachen

Amazon Transcribe kann automatisch Sprache in US-Englisch und Spanisch transkribieren. Unterstützung für weitere Sprachen wird bald angeboten.    

 

Einfach verwendbare API

Mit der Amazon Transcribe API ist es einfach, Sprache in Text umzuwandeln. Es ist keine komplizierte Programmierung erforderlich. Rufen Sie einfach die API mit ein paar Zeilen Code auf. Transcribe gibt dann den Text von Ihrer Audiodatei zurück, die in Amazon S3 gespeichert ist.

Unterstützung für benutzerdefiniertes Vokabular (wird bald angeboten)

Mit Amazon Transcribe können Sie das Vokabular Ihrer Spracherkennung erweitern und anpassen. Sie können neue Wörter (zusammen mit ihrer Aussprache) zum Basisvokabular hinzufügen und hochgenaue spezifische Transkriptionen für Ihren Anwendungsfall generieren, auch wenn die Äußerungen unter Umständen spezialisierte Terminologie und Fachbegriffe oder einmalige Produktnamen enthalten. Mit dieser Funktion können Sie Zeit und zusätzliche Bearbeitung sparen, da im weiteren Verlauf keine Korrekturen mehr erforderlich sind.

Generierung von Zeitstempeln

Amazon Transcribe gibt für jedes Wort einen Zeitstempel aus, sodass Sie die Audiokomponente einfach durch Suchen nach dem Text in der Originalaufzeichnung finden können.

 

Erkennung von mehreren Sprechern (wird bald angeboten)

Amazon Transcribe kann erkennen, wenn der Sprecher wechselt und den transkribierten Text entsprechend zuordnen. Auf diese Weise kann sich der Arbeitsaufwand zum Transkribieren von Audiokomponenten mit mehreren Sprechern wie Telefongespräche, Interviews und Fernsehshows erheblich verringern.

Anwendungsfälle

Amazon Transcribe bietet Transkriptionen für eine große Bandbreite an Anwendungsfällen einschließlich Kundenservice, Untertiteln, Suchen und Compliance.

Verbessern des Kundenservice

Durch Konvertieren von Audioeingaben in Text können Sie mit Amazon Transcribe Textanalyse-Anwendungen erstellen, mit denen Sie Spracheingaben durchsuchen und analysieren können. Kundenzentren können mit Amazon Transcribe sprachbasierte Interaktionen transkribieren und die Daten mithilfe anderer AWS Services wie Amazon Comprehend durchsuchen, um Bedeutung und Absichten aus Gesprächen zu extrahieren.

Erfassen/Untertiteln von Workflows

Mit Amazon Transcribe können Sie die Generierung von Inhalten unterstützen; Medienverteiler können ihre Reichweite und den Zugriff verbessern, indem sie automatisch Untertitel mit Zeitstempel generieren, die zusammen mit dem Videoinhalt angezeigt werden.

Katalogisieren von Audio-Archiven

Mit dem Service können Sie Audio- und Videobestände in vollständig durchsuchbaren Archiven transkribieren, um die Compliance zu überwachen und Risiken zu verwalten. Die Kunden können mit Amazon Transcribe Audio in Text konvertieren und Amazon ElasticSearch verwenden, um Indexierungen und textbasierte Suchen in ihrer Audio-/Videobibliothek durchzuführen.

Kundenreferenzen

RingDNA ist ein Modul zur Beschleunigung von Unternehmensverkäufen und eine Sprachkommunikationsplattform. Interne Verkaufsteams nutzen RingDNA, um die Produktivität erheblich zu erhöhen, intelligentere Verkaufsgespräche zu führen, vorhersehbare Einsichten in Verkäufe zu erhalten und Vertreter zu schulen, sodass diese schnellere Erfolge aufweisen können, als jemals zuvor. 

"RingDNA ist eine End-to-End-Kommunikationsplattform für Verkaufsteams. Hunderte Unternehmensorganisationen nutzen RingDNA, um die Produktivität erheblich zu erhöhen, intelligentere Verkaufsgespräche zu führen, vorhersehbare Einsichten in Verkäufe zu erhalten, ihre Erfolgsquoten zu erhöhen und Vertreter zu schulen, sodass diese schnellere Erfolge aufweisen können, als jemals zuvor. Eine kritische Komponente der Conversation AI von RingDNA ist, dass eine Sprache-Text-Umwandlung bester Qualität erforderlich ist, um Transkriptionen für jeden Telefonanruf anzubieten. RingDNA ist begeistert von Amazon Transcribe, da es eine Spracherkennung von hoher Qualität im richtigen Maßstab gibt, sodass wir jeden Anruf einfacher in Text transkribieren können."

Howard Brown – CEO & Gründer von  RingDNA

Isentia ist ein führender Anbieter für Medienintelligenz im asiatisch-pazifischen Raum mit Hauptsitz in Sydney, Australien. Das Unternehmen arbeitet mit 18 Büros in dieser Region und unterstützt mehr als 5 000 Kunden weltweit, einschließlich 84 der 100 Top-Marken der Welt. Die Produkte von Isentia unterstützen ihre Kunden dabei, informiertere und zeitsparender Unternehmens- und Kommunikationsentscheidungen zu treffen.

"Bei Isentia können Kunden die Medienberichterstattung ihrer Marken analysieren und überwachen. Wir erstellen mehr als 13 000 Zusammenfassungen von Radio- und Fernsehinhalten pro Tag. Mit Amazon Transcribe können wir alle Audio-/Videoinhalte transkribieren, die wir überwachen, und können die Textdaten mit Amazon Clair analysieren. Dank Funktionen wie Zeitstempel und Zeichensetzung können wir die Daten sehr einfach durchsuchen und analysieren und unseren Kunden wichtige Einsichten zur Überprüfung zu präsentieren."

Andrea Walsh – CIO, Isentia

Weitere Informationen zu den Amazon Transcribe-Preisen

Zur Seite mit den Preisen
Sind Sie startbereit?
Für die Vorversion registrieren
Haben Sie Fragen?
Kontakt