Publicado en: Aug 11, 2021
El SDK de Amazon Chime permite a los desarrolladores incorporar audio en tiempo real, vídeo y uso compartido de la pantalla a las aplicaciones web o móviles. A partir de hoy, los desarrolladores pueden superponer subtítulos, crear una transcripción o realizar análisis de contenido en tiempo real con la transcripción de audio en directo impulsada por Amazon Transcribe o Amazon Transcribe Medical.
Para crear transcripciones de reuniones en tiempo real sin que el audio salga de la red de AWS, el SDK de Amazon Chime ahora incluye una integración en el lado del servicio con la cuenta de Amazon Transcribe. Con el fin de mejorar la precisión en escenarios de voces duplicadas, el audio de los usuarios se procesa por separado antes de mezclarlo para la reunión. Amazon Chime utiliza su algoritmo de hablante activo para seleccionar a los dos hablantes activos principales y después envía el audio de estos hablantes a Amazon Transcribe, en canales independientes, a través de una sola transmisión. Para reducir la latencia, las transcripciones atribuidas a los usuarios se envían directamente a cada participante de la reunión a través de mensajes de datos. Cuando se utiliza una canalización de medios para capturar el audio de la reunión, también se captura la información de la transcripción de la reunión.
Los desarrolladores pueden acceder a todos los lenguajes de streaming compatibles con Amazon Transcribe, así como a características como vocabularios personalizados y filtros de vocabulario. Si utilizan Amazon Transcribe Medical, los desarrolladores pueden elegir la especialidad y el tipo de conversación, así como, opcionalmente, proporcionar cualquier vocabulario personalizado de su elección. Se aplican los costos estándar de Amazon Transcribe y Amazon Transcribe Medical.
Para obtener más información sobre el SDK de Amazon Chime y la transcripción en directo con Amazon Transcribe o Amazon Transcribe Medical, consulte los siguientes recursos: