Veröffentlicht am: Jul 17, 2018
Amazon Transcribe ist ein automatischer Spracherkennungsservice (ASR), mit dem Sie Ihre Anwendungen ganz einfach mit Sprach-zu-Text-Funktionen erweitern können. Sie können Amazon Transcribe verwenden, um Texttranskripte von Audio- und Videodateien zu erstellen. In Kürze wird Amazon Transcribe eine Funktion namens „Kanalsynthese“ unterstützen, mit der Audio besser verarbeitet werden kann, wenn jeder Sprecher auf einem anderen Kanal aufnimmt. Zum Beispiel wird eine Stereospur mit dem Interviewer auf der linken und der Interviewpartner auf der rechten Seite gespeichert.
Contact Center profitieren erheblich von der Kanalsynthesefunktion, da sie Transkriptionen von Mehrkanal-Anrufaufzeichnungen erstellen. In der Regel werden ein Agent und ein Anrufer auf separaten Kanälen aufgezeichnet und in einer einzigen Audiodatei zusammengeführt. Zum Beispiel speichern Contact Center-Anwendungen wie Amazon Connect den Stereo-Audiokanal der Kundendienstmitarbeiter und Kunden separat. Die Audioaufzeichnung des Kundendienstmitarbeiters wird auf dem rechten Audiokanal gespeichert. Alle eingehenden Audiosignale, z. B. der Endkunde, werden im linken Kanal gespeichert. Contact Center können die einzelne Audiodatei an Amazon Transcribe senden, die die beiden Kanäle identifiziert, sie aufteilt, Transkriptionen für jeden Sprecher pro Kanal erstellt und dann ein zusammenhängendes, zusammengetragenes Transkript mit Kanalbeschriftungen erstellt. Mithilfe der Kanal-Kennzeichnung können Contact Center jetzt die einzelnen Sprecher mit höherer Genauigkeit und Effizienz besser identifizieren und analysieren. Darüber hinaus müssen Kunden nicht mehr die Aufzeichnungen jedes Kanals als einzelne Audiodateien für die Transkription einreichen, wodurch sowohl die Gesamtkosten als auch die Arbeitsbelastung für Contact Center reduziert werden.