Publicado en: Sep 21, 2021
Amazon Comprehend ha lanzado un conjunto de características para Comprehend Custom con el fin de conseguir mejoras continuas en los modelos, ofreciendo a los desarrolladores la posibilidad de crear nuevas versiones de modelos, realizar pruebas continuas en conjuntos de pruebas específicos y migrar nuevos modelos a los puntos de enlace existentes. Gracias a AutoML, el reconocimiento de entidades personalizado le permite personalizar Amazon Comprehend para identificar entidades específicas de su dominio. La clasificación personalizada le permite crear fácilmente modelos de clasificación de texto personalizados utilizando sus etiquetas específicas de negocio. Posteriormente, los modelos personalizados se pueden utilizar para realizar inferencias sobre los documentos de texto, tanto en tiempo real como en modo de procesamiento por lotes. La creación de un modelo personalizado es sencilla, no se necesita experiencia en machine learning. A continuación encontrará una descripción detallada de estas características:
Administración de modelos mejorada. En la mayoría de los proyectos de procesamiento de lenguaje natural (NLP), los modelos vuelven a recibir formación continua a lo largo del tiempo a medida que se recopilan nuevos datos o si existe una desviación entre el conjunto de datos de formación y los documentos procesados en la inferencia. Gracias al control de versiones de los modelos y a las actualizaciones de los puntos de enlace en vivo, puede volver a formar continuamente nuevas versiones de los modelos, comparar las métricas de precisión de las distintas versiones y actualizar los puntos de enlace en vivo con el modelo de mejor rendimiento en un solo clic.
- El control de versiones del modelo le permite volver a formar nuevas versiones de un modelo existente, lo que facilita la iteración y el seguimiento de los cambios de precisión. Cada nueva versión se puede identificar con un ID de versión único.
- La actualización del punto de enlace activo permite actualizar un punto final síncrono activo con un nuevo modelo. De este modo, se garantiza la implementación de una nueva versión del modelo en la producción sin ningún tiempo de inactividad.
Control mejorado para la formación/evaluación de modelos. La preparación de datos y la evaluación de modelos suelen ser la parte más tediosa de cualquier proyecto de PNL. La evaluación de modelos y la resolución de problemas pueden ser a menudo confusas sin una indicación clara de la división de los datos de formación y de prueba. Ahora puede proporcionar conjuntos de datos de formación y de prueba separados durante la formación de modelos. También hemos lanzado un nuevo modo de formación que mejora la precisión de la inferencia en documentos extensos, que abarcan varios párrafos.
- El conjunto de datos de prueba proporcionado por el cliente le permite proporcionar un conjunto de datos de prueba opcional durante la formación de modelos. Anteriormente, había que ejecutar manualmente un trabajo de inferencia en un conjunto de prueba para evaluar un modelo. A medida que se recogen datos adicionales y se forman nuevas versiones del modelo, la evaluación del rendimiento del modelo utilizando el mismo conjunto de datos de prueba puede proporcionar una comparativa justa entre las versiones del modelo.
- El nuevo modo de formación mejora la precisión del modelo de reconocimiento de entidades para documentos extensos, que contienen varios párrafos. Durante la formación de modelos utilizando anotaciones CSV, la elección del formato de entrada ONE_DOC_PER_FILE para documentos extensos permite que el modelo aprenda más incrustaciones contextuales, mejorando significativamente la precisión del modelo.
Para obtener más información y comenzar, visite la página del producto Amazon Comprehend o nuestra documentación.