Amazon Comprehend는 Machine Learning을 사용하여 텍스트에서 통찰을 얻는 자연어 처리(NLP) 서비스입니다. Amazon Comprehend는 핵심문구 추출, 감성 분석, 엔터티 인식, 주제 모델링 및 언어 감지 API를 제공하므로 자연 언어 처리를 애플리케이션에 쉽게 통합할 수 있습니다. 애플리케이션에서 Amazon Comprehend API를 호출하고 소스 문서 또는 텍스트의 위치를 입력하면 됩니다. API는 엔터티, 핵심 문구, 감성 및 언어를 애플리케이션에서 사용할 수 있는 JSON 형식으로 출력합니다.

핵심 문구 추출

핵심 문구 추출 API는 핵심 문구 또는 논점과 이것이 핵심 문구임을 뒷받침하는 신뢰도 점수를 반환합니다.

  • 예시: 이 예에서 고객은 DSLR 카메라를 즉석 필름 카메라와 비교합니다. API는 핵심 문구를 추출하고, 핵심 문구가 반복되는 횟수를 세고, 결과에 대한 신뢰도 점수를 반환합니다.

    샘플 텍스트: 저는 열성적인 사진 작가로서, 취미용으로 들고 다니는 DSLR이나 즉석 필름 카메라로 사진을 찍곤 합니다. 성능과 편의성은 DSLR이 최고이지만 즉석 필름 카메라에는 마술처럼 신비한 면이 있습니다. 실제 필름에 사진을 찍기 때문이거나, 촬영하는 모든 사진이 하나뿐인 물리적 실체로 남기 때문이겠죠(온갖 사진이 넘쳐나는 Instagram과 Facebook 세상에서 더욱 각별한 느낌을 주죠). 한 가지 확실한 것은, 사용하는 과정 자체가 매우 재미있고 파티에서 사람들의 눈길을 끌 수 있다는 것입니다.

    핵심 문구 개수 신뢰도
    열성적인 사진 작가 1 0.99
    DSLR 2 0.97
    즉석 필름 카메라 2 0.99
    취미용 1 0.99
    성능과 편의성 1 0.94
    실제 필름 1 0.99
    모든 사진 1 0.92
    하나뿐인 물리적 실체 1 0.99
    오늘 1 0.91
    세상 1 0.99
    Instagram과 Facebook 1 0.99

감성 분석

감성 분석 API는 텍스트(긍정, 부정, 중립 또는 혼합)의 전체적인 감성을 반환합니다.

구문 분석

Amazon Comprehend 구문 API를 사용하는 고객은 토큰화 및 품사(PoS)를 사용하여 텍스트를 분석하고 텍스트 내에서 명사 및 형용사와 같은 단어 경계와 레이블을 식별할 수 있습니다.

엔터티 인식

엔터티 인식 API는 입력된 텍스트를 기반으로 자동 분류된 명명된 엔터티("사람", "장소", "위치" 등)를 반환합니다.

의학적으로 명명된 개체 및 관계 추출(NERe)

의학적으로 명명된 개체 및 관계 추출(NERe) API는 약물, 건강 상태, 검사, 치료 및 절차(TTP), 해부학 및 보호된 건강 정보(PHI)와 같은 의료 정보를 반환합니다. 또한 추출된 약물 관련 하위 유형과 TTP 사이의 관계를 식별합니다. 개체 "특성"(부정 또는 진단이 증상이나 징후인 경우)으로 제공되는 컨텍스트 정보도 있습니다. 아래 표는 관련 하위 유형 및 개체 특성을 사용하여 추출한 정보를 보여줍니다.

PHI만 추출하려면 보호된 건강 정보 데이터 식별(PHId) API를 사용할 수 있습니다.

사용자 지정 개체

사용자 지정 개체로 Amazon Comprehend를 사용자 지정하여 해당 도메인 특유의 용어를 찾아볼 수 있습니다. Comprehend는 AutoML을 통해 소량의 프라이빗 예제 인덱스(예: 정책 번호 및 정책 번호가 사용된 텍스트의 목록)에서 학습한 다음, 다른 모든 텍스트 블록에서 그 용어를 인식하도록 사용자 지정 프라이빗 모델을 훈련시킵니다. 서버를 관리할 필요도, 알고리즘을 숙지할 필요도 없습니다.

언어 감지

언어 감지 API는 100개 이상의 언어로 작성된 텍스트를 자동으로 식별하고, 언어의 우세함을 뒷받침하는 신뢰도 점수와 함께 우세 언어를 반환합니다.

Custom Classification

Custom Classification API를 사용하면 ML을 배우지 않고도 사업 고유의 레이블로 사용자 지정 텍스트 분류 모델을 손쉽게 빌드할 수 있습니다. 예를 들어 고객 지원 조직은 사용자 지정 분류 기능을 사용하여 고객이 문제를 어떻게 설명하는지에 따라 문제 유형별로 인바운드 요청을 자동으로 분류할 수 있습니다. 사용자 지정 모델을 만드는 것은 간단합니다. 사용하려는 각 레이블에 대한 텍스트 예제를 제공하면, Comprehend가 이를 교육하여 사용자 지정 모델을 생성합니다. 기계 학습 경험을 필요 없으며 코드를 전혀 사용하지 않고 사용자 지정 모델을 구축할 수 있습니다. 고객 분류자를 현재 애플리케이션에 통합할 수 있도록 SDK가 제공됩니다. 사용자 지정 모델을 사용하면 손쉽게 웹 사이트 댓글을 조정하고, 고객 피드백을 분류하고, 작업 그룹 문서를 정리할 수 있습니다. 자세한 내용은 이 설명서 페이지를 참조하십시오.

주제 모델링

주제 모델링은 Amazon S3에 저장된 문서 집합에서 관련 용어 또는 주제를 식별합니다. 집합에서 가장 공통적인 주제를 식별하고 이를 그룹으로 구성한 다음, 어떤 문서가 어떤 주제에 속하는지 매핑합니다.

다중 언어 지원

Amazon Comprehend는 영어, 프랑스어, 독일어, 이탈리아어, 포루투갈어 및 스페인어 텍스트에 대한 텍스트 분석을 수행할 수 있습니다. 따라서 여러 언어로 된 텍스트를 인식하고 Amazon Translate를 통해 텍스트를 영어, 프랑스어, 독일어, 이탈리아어, 포루투갈어 및 스페인어로 변환한 다음 Amazon Comprehend를 사용해 텍스트를 분석할 수 있는 애플리케이션을 만들 수 있습니다.

Amazon Comprehend 요금에 대해 자세히 알아보기

요금 페이지로 이동하기
시작할 준비가 되셨습니까?
가입
추가 질문이 있으십니까?
문의처