Veröffentlicht am: Dec 7, 2022
Wir freuen uns, heute bekannt geben zu können, dass Amazon Transcribe Custom Language Models (CLM) jetzt Deutsch und Japanisch sowohl im Batch- als auch im Streaming-Modus unterstützt. Amazon Transcribe ist ein automatischer Spracherkennungsservice (ASR), mit dem Sie Ihre Anwendungen ganz einfach mit Sprache-zu-Text-Funktionen erweitern können. Mit CLM können Sie bereits vorhandene Daten verwenden, um eine benutzerdefinierte Sprach-Engine für Ihre speziellen Anwendungsfälle der Batch- und Streaming-Transkription zu erstellen. Für die Erstellung Ihres CLM sind keine Machine-Learning-Vorkenntnisse erforderlich.
CLM verwendet Textdaten, die Sie bereits besitzen, z. B. Website-Inhalte, Bedienungsanleitungen und andere Ressourcen, die das individuelle Lexikon und Vokabular Ihres Bereichs abdecken. Laden Sie Ihren Trainingsdatensatz hoch, um ein CLM zu erstellen, und führen Sie Transkriptionsaufträge mit Ihrem neuen CLM aus. Amazon Transcribe CLM richtet sich an Kunden, die in so unterschiedlichen Bereichen wie Recht, Finanzen, Gastgewerbe, Versicherungen und Medien tätig sind. CLMs wurden entwickelt, um die Transkriptionsgenauigkeit für bereichsspezifische Sprache zu verbessern. Dazu gehören alle Inhalte, die außerhalb dessen liegen, was Sie in normalen, alltäglichen Gesprächen hören würden. Wenn Sie beispielsweise den Ablauf einer wissenschaftlichen Konferenz transkribieren, erkennt eine Standardtranskription viele der von den Vortragenden verwendeten wissenschaftlichen Begriffe wahrscheinlich nicht. Mit Amazon Transcribe CLM können Sie ein benutzerdefiniertes Sprachmodell trainieren, um die in Ihrer Disziplin verwendeten Fachbegriffe zu erkennen.
CLM unterstützt jetzt Deutsch und Japanisch für Batch- und Streaming-Transkriptionen und ist in allen AWS-Regionen verfügbar, in denen Amazon Transcribe angeboten wird. Melden Sie sich bei der Servicekonsole von Amazon Transcribe an, um mit der Erstellung Ihres eigenen benutzerdefinierten Spracherkennungsmodells zu beginnen. Weitere Details zur CLM-Funktion finden Sie im Blogbeitrag „Building custom language models to supercharge speech-to-text performance for Amazon Transcribe“. Weitere Informationen finden Sie auf der Dokumentationsseite zu Amazon Transcribe.