Veröffentlicht am: Jun 9, 2022
Entwickler können ab sofort die Live-Transkription mit dem Amazon Chime SDK in AWS GovCloud (USA)-Regionen verwenden, um Live-Audio-Transkriptionen zu erzeugen. Mit dem Amazon Chime SDK können Entwickler eine intelligente Echtzeit-Audio, -Video und -Bildschirmfreigabe zu ihren Web- und Mobilanwendungen hinzufügen. Die Erweiterung in die AWS GovCloud (USA)-Regionen ermöglicht es US-Regierungsbehörden und Auftragnehmern, Kommunikations-Workloads in die Cloud zu verlagern und gleichzeitig ihre spezifischen regulatorischen und Compliance-Anforderungen zu erfüllen.
Mit dem Amazon Chime SDK können Entwickler WebRTC-Mediensitzungen in beiden AWS GovCloud (USA)-Regionen hosten. Das Amazon Chime SDK ist mit Amazon Transcribe integriert, um jedem Sitzungsteilnehmer direkt die Transkriptionsinformationen „Wer hat was gesagt“ zu liefern. Die Audiosignale jedes Benutzers werden einzeln verarbeitet, um die Genauigkeit zu verbessern, wenn mehrere Personen miteinander sprechen. Die Audiosignale der ersten beiden aktiven Sprecher werden in getrennten Kanälen über einen einzigen Stream an Amazon Transcribe gesendet. Entwickler können die Transkriptionsinformationen verwenden, um in Echtzeit maschinell erzeugte Untertitel zu rendern oder dynamisch ein Sitzungsprotokoll zu erstellen.
Die Live-Transkription verwendet Amazon Transcribe in der Region AWS GovCloud (USA-West) und bietet Zugriff auf alle von Amazon Transcribe unterstützten Streaming-Sprachen sowie Funktionen wie automatische Spracherkennung, Vokabularfilter, Inhaltserkennung, benutzerdefinierte Vokabulare und benutzerdefinierte Sprachmodelle. Es gelten Standard-Amazon-Transcribe-Kosten.
Um mehr über das Amazon-Chime-SDK und die Live-Transkription mit Amazon Transcribe zu erfahren, lesen Sie die folgenden Ressourcen:
- Amazon Chime SDK und Amazon Transcribe-Websites
- Verwenden der Live-Transkription im Amazon-Chime-SDK-Entwicklerhandbuch
- Live-Transkription-APIs in der Amazon-Chime-SDK-API-Referenz