Veröffentlicht am: Aug 11, 2021
Mit dem Amazon Chime SDK können Entwickler Echtzeit-Audio, Video und Bildschirmfreigabe zu ihren Web- und Mobilanwendungen hinzufügen. Ab heute können Entwickler Untertitel einblenden, ein Transkript erstellen oder eine Echtzeit-Inhaltsanalyse mit Live-Audiotranskription durchführen, die von Amazon Transcribe oder Amazon Transcribe Medical unterstützt wird.
Um Meeting-Transkriptionen in Echtzeit zu erstellen, ohne dass der Ton das AWS-Netzwerk verlässt, enthält das Amazon Chime SDK jetzt eine service-seitige Integration in Ihr Amazon Transcribe-Konto. Um die Genauigkeit bei Doppelgesprächen zu verbessern, werden die Audiosignale der Teilnehmer getrennt verarbeitet, bevor sie in die Besprechung gemischt werden. Amazon Chime verwendet seinen Algorithmus für aktive Sprecher, um die beiden wichtigsten aktiven Sprecher auszuwählen, und sendet dann deren Audiosignale in getrennten Kanälen über einen einzigen Stream an Amazon Transcribe. Um die Latenzzeit zu verkürzen, werden vom Benutzer zugewiesene Transkriptionen über Datennachrichten direkt an jeden Sitzungsteilnehmer gesendet. Bei der Verwendung einer Medienpipeline für die Audioaufzeichnung eines Meetings werden auch die Transkriptionsinformationen des Meetings erfasst.
Entwickler können auf alle Streaming-Sprachen zugreifen, die von Amazon Transcribe unterstützt werden, sowie auf Funktionen wie benutzerdefinierte Vokabulare und Vokabelfilter. Bei der Verwendung von Amazon Transcribe Medical können Entwickler das Fachgebiet und die Gesprächsart auswählen und optional ein benutzerdefiniertes Vokabular bereitstellen. Es gelten die Standardkosten für Amazon Transcribe und Amazon Transcribe Medical.
Um mehr über das Amazon Chime SDK und die Live-Transkription mit Amazon Transcribe oder Amazon Transcribe Medical zu erfahren, lesen Sie die folgenden Ressourcen: