게시된 날짜: Sep 21, 2021
Amazon Comprehend는 개발자에게 새 모델 버전을 생성하고, 특정 테스트 세트에서 지속적으로 테스트하고, 새 모델을 기존 엔드포인트로 마이그레이션할 수 있는 기능을 제공하여 지속적인 모델 개선을 가능하게 하는 Comprehend Custom용 기능 제품군을 출시했습니다. AutoML을 사용하면 사용자 지정 엔터티 인식을 통해 Amazon Comprehend를 사용자 지정하여 도메인에 특정한 엔터티를 식별할 수 있습니다. 사용자 지정 분류를 사용하면 비즈니스별 레이블을 사용하여 사용자 지정 텍스트 분류 모델을 쉽게 구축할 수 있습니다. 사용자 지정 모델은 이후 실시간 및 일괄 처리 모드에서 텍스트 문서에 대한 추론을 수행하는 데 사용할 수 있습니다. 사용자 지정 모델을 만드는 것은 간단합니다. 기계 학습 경험이 필요하지 않습니다. 다음은 이러한 기능에 대한 자세한 설명입니다.
향상된 모델 관리 - 대부분의 자연어 처리(NLP) 프로젝트의 경우 새로운 데이터가 수집되거나 추론 시 처리되는 문서와 훈련 데이터 세트 사이에 편차가 있는 경우 모델이 지속적으로 재훈련됩니다. 모델 버전 관리 및 라이브 엔드포인트 업데이트를 사용하면 한 번의 클릭으로 새 모델 버전을 지속적으로 재훈련하고, 버전 간 정확도 지표를 비교하고, 라이브 엔드포인트를 최고의 성능 모델로 업데이트할 수 있습니다.
- 모델 버전 관리를 사용하면 기존 모델의 최신 버전을 다시 훈련하여 정확도의 변경을 더 쉽게 반복하고 추적할 수 있습니다. 각 새 버전은 고유한 버전 ID로 식별할 수 있습니다.
- 활성 엔드포인트 업데이트를 사용하면 활성 동기 엔드포인트를 새 모델로 업데이트할 수 있습니다. 따라서 가동 중단 시간 없이 새 모델 버전을 프로덕션에 배포할 수 있습니다.
모델 훈련/평가에 대한 제어 개선 - 데이터 준비 및 모델 평가는 NLP 프로젝트에서 가장 지루한 부분인 경우가 많습니다. 모델 평가 및 문제 해결은 훈련 및 테스트 데이터 분할에 대한 명확한 표시 없이 종종 혼동될 수 있습니다. 이제 모델 학습 중에 별도의 훈련 및 테스트 데이터 세트를 제공할 수 있습니다. 또한 당사는 여러 단락에 걸쳐 긴 문서에 대한 추론 정확도를 개선하는 새로운 훈련 모드를 출시했습니다.
- 고객 제공 테스트 데이터 집합을 사용하면 모델 훈련 중에 선택적 테스트 데이터 집합을 제공할 수 있습니다. 이전에는 모델을 평가하기 위해 테스트 집합에 대해 추론 작업을 수동으로 실행해야 했습니다. 추가 데이터가 수집되고 새 모델 버전이 훈련됨에 따라 동일한 테스트 데이터 집합을 사용하여 모델 성능을 평가하면 모델 버전 간에 공정한 비교를 제공할 수 있습니다.
- 새로운 훈련 모드는 여러 단락을 포함하는 긴 문서에 대한 엔터티 인식기 모델의 정확도를 향상시킵니다. CSV 주석을 사용하는 모델 훈련 중에 긴 문서에 대해 ONE_DOC_PER_FILE 입력 형식을 선택하면 모델이 더 많은 컨텍스트 임베딩을 학습하여 모델 정확도를 크게 향상시킬 수 있습니다.