게시된 날짜: Aug 3, 2022

AWS Comprehend가 모델 교육에 필요한 주석 요구 사항을 줄여 고객이 사용자 지정 엔터티 인식을 좀 더 쉽게 시작할 수 있도록 지원합니다. Amazon Comprehend는 텍스트에서 주요 구문, 상황별 엔터티, 이벤트 및 감정을 추출하는 API를 제공하는 자연어 처리(NLP) 서비스입니다. 엔터티는 사람, 장소, 조직, 신용 카드 번호 등과 같은 문서의 항목을 나타냅니다. AWS Comprehend의 사용자 지정 엔터티 인식(CER)을 활용하면 몇 개의 간단한 단계를 거쳐 비즈니스에 고유한 엔터티로 모델을 교육할 수 있습니다. 모델을 효과적으로 교육하기에 충분한 수의 세부 정보만 제공하면 거의 모든 종류의 엔터티를 식별할 수 있습니다.

지금까지는 엔터티당 최소 250개의 문서와 100개의 주석을 사용하여 Amazon Comprehend 사용자 지정 엔터티 인식기를 교육해야 했습니다. 오늘부터는 Amazon Comprehend 사용자 지정 엔터티 인식 모델을 교육하기 위한 최소 요구 사항이 엔터티 유형당 주석 25개로 줄어들었습니다. 내부적으로 개선된 모델링을 통해 이제 3개에 불과한 주석 문서로 실험을 시작하고, 예비 결과는 분석하는 것은 물론, 추가 주석 및 문서를 포함하는 방식으로 이를 반복할 수 있습니다. 줄어든 한도는 일반 텍스트 문서에 대한 사용자 지정 엔터티 인식 모델에만 적용됩니다.

자세히 알아보고 시작하려면 Amazon Comprehend 출시 블로그 게시물, 제품 페이지 또는 설명서를 참조하세요.