이 AWS 솔루션 구현에서 제공하는 기능

문서 이해 솔루션(DUS)은 파일 수집 및 분석, 문서 텍스트 추출, 정형 데이터(테이블, 키 값 페어) 식별, 중요 정보(엔터티) 추출, 데이터에서 스마트 검색 인덱스 생성 등을 지원하는 사용하기 간편한 웹 애플리케이션을 제공합니다. 또한 파일을 직접 업로드할 수 있고 AWS 계정의 Amazon Simple Storage Service(Amazon S3) 버킷에서 분석 파일에 액세스할 수 있습니다.

이 솔루션은 다양한 업종에 적용되는 다음과 같은 비즈니스 문제를 해결하는 AWS 인공 지능(AI) 서비스를 사용합니다.

  • 검색 및 탐색: 여러 스캔 문서, PDF 및 이미지에 걸쳐 정보 검색
  • 규정 준수: 문서에서 정보 수정
  • 워크플로 자동화: 기존 업스트림 및 다운스트림 애플리케이션에 쉽게 연결 

 

AWS 솔루션 구현 개요

아래 다이어그램은 솔루션의 구현 안내서와 함께 AWS CloudFormation 템플릿을 사용하여 자동으로 배포할 수 있는 아키텍처를 보여줍니다.

문서 이해 솔루션 | 아키텍처 다이어그램

문서 이해 솔루션 아키텍처

AWS CloudFormation 템플릿은 Amazon S3 버킷에서 호스팅되고 Amazon CloudFront 배포에 의해 서비스되는 정적 웹 애플리케이션을 배포합니다. 사용자는 Amazon Cognito를 사용하여 인증 받습니다. 웹 애플리케이션은 AWS Lambda 함수에서 지원되는 Amazon API Gateway API를 사용하여 백엔드와 상호 작용합니다. 문서는 웹 애플리케이션을 사용하여 업로드되거나, 대량 처리를 위해 전용 Amazon S3 버킷에 직접 업로드됩니다. API에 의해 문서 처리가 시작되면 Amazon DynamoDB 테이블에 항목을 추가하는 Lambda 함수가 트리거됩니다. 해당 테이블은 처리 작업을 감독하는 두 번째 Lambda 함수를 트리거합니다. 업로드되는 파일의 형식에 따라 처리 경로가 결정됩니다. Amazon Textract는 파일에서 텍스트 및 구조 정보를 추출합니다. 그러면 추출된 텍스트가 추가적인 분석을 위해 Amazon ComprehendAmazon Comprehend Medical로 전달됩니다.

분석 결과는 Amazon S3 버킷에 저장되고 메타데이터는 DynamoDB 데이터베이스에 저장됩니다. 추출된 정보는 Amazon Elasticsearch Service(Amazon ES)에서, 그리고 활성화된 경우 Amazon Kendra에서 문서를 인덱싱하는 데 사용됩니다.

문서 이해 솔루션

버전 1.0.1
릴리스 날짜: 2021년 1월
작성: AWS

예상 배포 시간: 30~60분

소스 코드  CloudFormation 템플릿 
아래의 단추를 사용하여 이 솔루션 구현 업데이트를 구독하세요.
참고: RSS 업데이트에 가입하려면 사용 중인 브라우저에 대해 RSS 플러그인이 활성화되어 있어야 합니다.
이 솔루션 구현이 도움이 되었습니까?
피드백 제공 

기능

검색 및 탐색

여러 스캔 문서, PDF 및 이미지에 걸쳐 정보를 검색합니다.

AWS AI 서비스 활용

Amazon Textract를 사용하여 파일에서 텍스트 및 구조 정보를 추출한 후 보다 세부적인 분석을 위해 Amazon Comprehend 및 Amazon Comprehend Medical로 전달합니다.

규정 준수

문서에서 정보를 삭제합니다.
구축 아이콘
솔루션 직접 배포

AWS 솔루션 구현 라이브러리에서 일반적인 아키텍처 문제에 대한 답을 검색해 보실 수 있습니다.

자세히 알아보기 
APN 파트너 찾기
APN 파트너 찾기

시작하는 데 도움이 되는 AWS 공인 컨설팅 및 기술 파트너를 찾으십시오.

자세히 알아보기 
살펴보기 아이콘
솔루션 컨설팅 오퍼 살펴보기

AWS의 컨설팅 오퍼 포트폴리오를 살펴보고 솔루션 배포 시 AWS의 검증된 지원을 받으세요.

자세히 알아보기