Publicado en: Nov 24, 2021

El SDK de Amazon Chime permite a los desarrolladores agregar capacidades de audio, video, pantalla compartida y mensajería en tiempo real a las aplicaciones web o móviles. El SDK de Amazon Chime ahora ofrece reducción del eco basada en machine learning (ML) para mejorar las experiencias de audio. Los ecos acústicos interrumpen las reuniones o llamadas de conferencias cuando el micrófono capta el sonido del altavoz y este sonido pasa otra vez a la llamada. La nueva capacidad de reducción del eco basada en ML está diseñada para reducir ecos acústicos y preservar la calidad de la voz en condiciones en las que haya voces duplicadas, es decir, cuando dos o más personas hablan a la vez.

La reducción del eco del SDK de Amazon Chime también incluye Amazon Voice Focus, la tecnología desarrollada para ofrecer reducción del ruido en el SDK de Amazon Chime. Amazon Voice Focus usa machine learning y modelos de habla y escucha para reducir los ruidos de fondo, como los ventiladores, las podadoras y los ladridos de perros, así como también los ruidos en primer plano, como el tecleo y el ruido de los papeles al mezclarlos, para que el ruido no desvíe de las conversaciones e interacciones. Los desarrolladores pueden configurar sus reuniones con capacidades de reducción del eco a través de la API CreateMeeting del SDK de Amazon Chime. Tras la configuración, los desarrolladores pueden, además, habilitar la característica para el cliente aplicando el modelo de ML apropiado para la reducción del eco cuando los asistentes se unen a la reunión.

El procesamiento de la reducción del eco del SDK de Amazon Chime se lleva a cabo en tiempo real usando WebAssembly (WASM) y la técnica SIMD (una instrucción, múltiples datos) para una operación eficiente en la mayoría de ordenadores y navegadores modernos. Esta oferta está actualmente disponible en el SDK de Amazon Chime para Javascript.