Veröffentlicht am: Mar 28, 2019
Amazon Transcribe ist ein vollständig verwalteter automatischer Spracherkennungsservice (Automatic Speech Recognition, ASR), mit dem Sie Ihre Anwendungen ganz einfach mit Sprache-zu-Text-Funktionen erweitern können. Amazon Transcribe unterstützt jetzt benutzerdefinierte Aussprachen und Anzeigeformate, wodurch die Kapazität der benutzerdefinierten Vokabularfunktion erweitert wird.
Sie können Amazon Transcribe weitere Informationen darüber geben, wie Sprache in der Eingabeaudio- oder Eingabevideodatei verarbeitet werden soll, indem Sie ein benutzerdefiniertes Vokabular erstellen. Ein benutzerdefiniertes Vokabular ist eine Liste bestimmter Begriffe, die Amazon Transcribe in der Audioeingabe erkennen soll. Dabei handelt es sich im Allgemeinen um domänenspezifische Begriffe und Ausdrücke, Begriffe, die Amazon Transcribe nicht erkennt, oder Eigennamen.
Mit der Verwendung von Zeichen aus dem Internationalen Phonetischen Alphabet (IPA) können Sie jetzt jede benutzerdefinierte Terminologie um entsprechende benutzerdefinierte Aussprachen erweitern. Alternativ können Sie auch die Standardorthographie der Sprache verwenden, um die Art und Weise nachzuahmen, wie das Wort oder der Ausdruck klingt.
Darüber hinaus können Sie nun genau festlegen, wie eine Kundenterminologie bei der Transkription angezeigt werden soll (z. B. „Straße“ als „Str.“ statt „STR“).
Die benutzerdefinierten Aussprache- und Anzeigeformen zur Erweiterung des benutzerdefinierten Vokabulars sind in allen Regionen verfügbar, in denen Amazon Transcribe verfügbar ist. Probieren Sie die neue benutzerdefinierte Vokabularfunktion über die Amazon Transcribe-Konsole aus, oder verwenden Sie die Befehlszeilenschnittstelle (Command Line Interface, CLI) und AWS SDKs. Weitere Informationen finden Sie auf dieser Dokumentationsseite.