Publicado en: Mar 11, 2021

Amazon Transcribe es un servicio de reconocimiento de voz automático (ASR) que permite a los desarrolladores agregar funciones de conversión de voz a texto a sus aplicaciones habilitadas por voz. Hasta ahora, Amazon Transcribe ha ofrecido puntuaciones de confianza para cada palabra en su salida de transcripción para su API por lotes (asíncrona). A partir de hoy, Amazon Transcribe también mostrará las puntuaciones de confianza a nivel de palabra para su API de transcripción en streaming (síncrona).

Las puntuaciones de confianza son las autoevaluaciones del servicio sobre lo bien que puede haber transcrito una palabra y no deben confundirse con las mediciones de precisión. Cada palabra tiene una puntuación de confianza asociada entre 0 y 1. Estas puntuaciones ofrecen a los desarrolladores una serie de oportunidades para implementar la lógica de posprocesamiento en las transcripciones de texto. Por ejemplo, es posible que solo desee utilizar los términos que cumplan un umbral de confianza determinado para cualquier posprocesamiento, como la búsqueda de palabras clave, la traducción o la revisión humana. Cualquiera que sea su aplicación de voz, las puntuaciones de confianza le proporcionan una herramienta adicional para aumentar o consumir transcripciones para su caso particular de uso de audio en streaming. Entre los casos más comunes de uso de las transcripciones en streaming se encuentran las transcripciones de llamadas en tiempo real y los subtítulos en directo para los medios de comunicación.
La puntuación de confianza a nivel de palabra para la transcripción de streaming está disponible en todas las regiones de AWS en las que está disponible la API de streaming de Amazon Transcribe. Visite nuestra consola de servicio hoy mismo para probarlo. Puede obtener más información consultando la documentación técnica.