이 AWS 솔루션은 어떤 작업을 수행합니까?

Document Understanding Solution은 파일 수집 및 분석, 문서 텍스트 추출, 정형 데이터(테이블, 키 값 페어) 식별, 중요 정보(엔터티) 추출, 데이터에서 스마트 검색 인덱스 생성 등을 지원하는 사용하기 간편한 웹 애플리케이션을 제공합니다. 또한 파일을 직접 업로드할 수 있고 AWS 계정의 Amazon Simple Storage Service(Amazon S3) 버킷에서 분석 파일에 액세스할 수 있습니다.

이 솔루션은 다양한 업종에 적용되는 다음과 같은 비즈니스 문제를 해결하는 AWS 인공 지능(AI) 서비스를 사용합니다.

  • 검색 및 탐색: 여러 스캔 문서, PDF 및 이미지에 걸쳐 정보 검색
  • 규정 준수: 문서에서 정보 수정
  • 워크플로 자동화: 기존 업스트림 및 다운스트림 애플리케이션에 쉽게 연결 

 

AWS 솔루션 개요

아래 다이어그램은 솔루션의 구현 가이드와 이에 수반되는 AWS CloudFormation 템플릿을 사용하여 자동으로 배포할 수 있는 아키텍처를 보여줍니다.

Document Understanding Solution 아키텍처

AWS CloudFormation 템플릿은 Amazon S3 버킷에서 호스팅되고 Amazon CloudFront 배포에 의해 서비스되는 정적 웹 애플리케이션을 배포합니다. 사용자는 Amazon Cognito를 사용하여 인증 받습니다. 웹 애플리케이션은 AWS Lambda 함수에서 지원되는 Amazon API Gateway API를 사용하여 백엔드와 상호 작용합니다. 문서는 웹 애플리케이션을 사용하여 업로드되거나, 대량 처리를 위해 전용 Amazon S3 버킷에 직접 업로드됩니다. API에 의해 문서 처리가 시작되면 Amazon DynamoDB 테이블에 항목을 추가하는 Lambda 함수가 시작됩니다. 해당 테이블은 처리 작업을 감독하는 두 번째 Lambda 함수를 시작합니다. 업로드되는 파일의 형식에 따라 처리 경로가 결정됩니다. Amazon Textract는 파일에서 텍스트 및 구조 정보를 추출합니다. 그러면 추출된 텍스트가 추가적인 분석을 위해 Amazon ComprehendAmazon Comprehend Medical로 전달됩니다.

분석 결과는 Amazon S3 버킷에 저장되고 메타데이터는 DynamoDB 데이터베이스에 저장됩니다. 추출된 정보는 Amazon OpenSearch ServiceAmazon Kendra(활성화된 경우)에서 문서를 인덱싱하는 데 사용됩니다.

Document Understanding Solution

버전 1.0.5
릴리스 날짜: 2022년 9월
작성자: AWS

예상 배포 시간: 30~60분

예상 비용  소스 코드  CloudFormation 템플릿 
아래의 단추를 사용하여 이 솔루션 구현 업데이트를 구독하세요.
참고: RSS 업데이트에 가입하려면 사용 중인 브라우저에 대해 RSS 플러그 인이 사용되어야 합니다.
이 솔루션 구현이 도움이 되었나요?
피드백 제공 

기능

검색 및 탐색

여러 스캔 문서, PDF 및 이미지에 걸쳐 정보를 검색합니다.

AWS AI 서비스 활용

Amazon Textract를 사용하여 파일에서 텍스트 및 구조 정보를 추출한 후 보다 세부적인 분석을 위해 Amazon Comprehend 및 Amazon Comprehend Medical로 전달합니다.

규정 준수

문서에서 정보를 삭제합니다.
구축 아이콘
AWS 솔루션 직접 배포

AWS 솔루션 라이브러리에서 일반적인 아키텍처 문제에 대한 답을 검색해 보실 수 있습니다.

자세히 알아보기 
APN 파트너 찾기
AWS 파트너 솔루션 찾기

시작하는 데 도움이 되는 AWS 파트너를 찾아보세요.

자세히 알아보기 
살펴보기 아이콘
살펴보기 지침

일반적인 사용 사례에 대한 권장 아키텍처 다이어그램, 샘플 코드 및 기술 콘텐츠를 찾아보세요.

자세히 알아보기