Amazon Comprehend를 사용하여 적은 양의 교육 문서로 사용자 지정 엔터티 인식 모델 교육

게시된 날짜: Aug 9, 2021

Amazon Comprehend는 기계 학습을 사용하여 텍스트 문서를 분석하고 텍스트에서 감정, 엔터티 및 주제와 같은 인사이트를 식별하는 자연어 처리(NLP) 서비스입니다. 오늘, 더 적은 수의 훈련 문서로 모델을 훈련할 수 있도록 사용자 지정 엔터티 인식 모델이 업데이트됩니다. 사용자 지정 엔터티 인식은 미리 설정된 일반 엔터티 유형 중 하나로 지원되지 않는 새 엔터티 유형을 식별할 수 있도록 하여 Amazon Comprehend의 기능을 확장합니다. 즉, LOCATION 또는 DATE, PERSON과 같은 엔터티 감지 API에서 엔터티 유형을 식별하는 것에 더해, 문서를 분석하고 PRODUCT_CODE, EMPLOYEE_ID, CONTRACTOR_NAME 또는 특정 요구 사항에 맞게 정의된 비즈니스 관련 엔터티와 같은 엔터티를 추출할 수 있습니다. 오늘부터, 필요한 최소 훈련 문서 수가 50%로 줄어듭니다. 즉, 문서 250개에서 엔터티 유형당 최소 100개의 주석을 사용하여 사용자 지정 모델을 훈련할 수 있습니다. 훈련 문서가 더 많은 경우에는 새로운 모델에서 이전보다 더 나은 결과를 얻을 수 있습니다.

업데이트된 사용자 지정 엔터티 인식 모델은 Amazon Comprehend가 제공되는 모든 AWS 리전에서 사용할 수 있습니다. 새 기능을 사용해 보려면 코드 없는 환경인 Amazon Comprehend 콘솔에 로그인하거나 AWS SDK를 다운로드하세요. 블로그에서 이 새로운 기능에 대해 자세히 알아볼 수도 있습니다.

Amazon Comprehend를 사용하여 적은 양의 교육 문서로 사용자 지정 엔터티 인식 모델 교육

Internet Explorer에 대한 지원 종료