Veröffentlicht am: Nov 24, 2021
Mit dem Amazon Chime SDK können Entwickler ihren Web- oder mobilen Anwendungen Audio-, Video-, Bildschirmfreigabe- und Messaging-Funktionen in Echtzeit hinzufügen. Das Amazon Chime SDK bietet jetzt auf Machine Learning (ML) basierende Echoreduktion, um das Audioerlebnis zu verbessern. Akustische Echos stören Besprechungen oder Konferenzgespräche, wenn der vom Lautsprecher abgespielte Ton vom Mikrofon aufgenommen wird und wieder in den Anruf zirkuliert. Die neue ML-basierte Echoreduktionsfunktion wurde entwickelt, um akustische Echos zu reduzieren und die Sprachqualität bei Gesprächen zu erhalten, wenn zwei oder mehr Personen gleichzeitig sprechen.
Die Echoreduktion des Amazon Chime SDK umfasst auch Amazon Voice Focus, die Technologie, die zur Rauschreduktion im Amazon Chime SDK entwickelt wurde. Amazon Voice Focus verwendet Machine Learning und Sprach- und Hörmodelle, um Hintergrundgeräusche wie Ventilatoren, Rasenmäher und bellende Hunde sowie Vordergrundgeräusche wie Tippen und Blättern von Papieren zu reduzieren – damit Geräusche nicht von Gesprächen und Verabredungen ablenken. Entwickler können ihre Besprechungen mit Echoreduktionsfunktionen über die CreateMeeting-API aus dem Amazon Chime SDK konfigurieren. Nach der Konfiguration müssen Entwickler die Funktion zusätzlich auf Client-Ebene aktivieren, indem sie das entsprechende ML-Modell zur Echoreduktion anwenden, wenn Teilnehmer der Besprechung beitreten.
Die Verarbeitung für die Amazon-Chime-SDK-Echoreduktion erfolgt in Echtzeit mit WebAssembly (WASM) und Single Instruction Multiple Data (SIMD) für einen effizienten Betrieb auf den meisten modernen Computern und Browsern. Dieses Angebot ist derzeit im Amazon Chime SDK für Javascript verfügbar.
Weitere Informationen über das Amazon-Chime-SDK finden Sie in den folgenden Ressourcen:
- Amazon-Chime-SDK-Website
- Amazon Chime SDK für JavaScript
- Amazon Chime SDK-Entwicklerhandbuch
- Amazon Chime SDK Voice Focus API