이 AWS 솔루션은 어떤 작업을 수행합니까?
Document Understanding Solution은 파일 수집 및 분석, 문서 텍스트 추출, 정형 데이터(테이블, 키 값 페어) 식별, 중요 정보(엔터티) 추출, 데이터에서 스마트 검색 인덱스 생성 등을 지원하는 사용하기 간편한 웹 애플리케이션을 제공합니다. 또한 파일을 직접 업로드할 수 있고 AWS 계정의 Amazon Simple Storage Service(Amazon S3) 버킷에서 분석 파일에 액세스할 수 있습니다.
이 솔루션은 다양한 업종에 적용되는 다음과 같은 비즈니스 문제를 해결하는 AWS 인공 지능(AI) 서비스를 사용합니다.
- 검색 및 탐색: 여러 스캔 문서, PDF 및 이미지에 걸쳐 정보 검색
- 규정 준수: 문서에서 정보 수정
- 워크플로 자동화: 기존 업스트림 및 다운스트림 애플리케이션에 쉽게 연결
AWS 솔루션 개요
아래 다이어그램은 솔루션의 구현 가이드와 이에 수반되는 AWS CloudFormation 템플릿을 사용하여 자동으로 배포할 수 있는 아키텍처를 보여줍니다.

Document Understanding Solution 아키텍처
AWS CloudFormation 템플릿은 Amazon S3 버킷에서 호스팅되고 Amazon CloudFront 배포에 의해 서비스되는 정적 웹 애플리케이션을 배포합니다. 사용자는 Amazon Cognito를 사용하여 인증 받습니다. 웹 애플리케이션은 AWS Lambda 함수에서 지원되는 Amazon API Gateway API를 사용하여 백엔드와 상호 작용합니다. 문서는 웹 애플리케이션을 사용하여 업로드되거나, 대량 처리를 위해 전용 Amazon S3 버킷에 직접 업로드됩니다. API에 의해 문서 처리가 시작되면 Amazon DynamoDB 테이블에 항목을 추가하는 Lambda 함수가 시작됩니다. 해당 테이블은 처리 작업을 감독하는 두 번째 Lambda 함수를 시작합니다. 업로드되는 파일의 형식에 따라 처리 경로가 결정됩니다. Amazon Textract는 파일에서 텍스트 및 구조 정보를 추출합니다. 그러면 추출된 텍스트가 추가적인 분석을 위해 Amazon Comprehend 및 Amazon Comprehend Medical로 전달됩니다.
분석 결과는 Amazon S3 버킷에 저장되고 메타데이터는 DynamoDB 데이터베이스에 저장됩니다. 추출된 정보는 Amazon OpenSearch Service와 Amazon Kendra(활성화된 경우)에서 문서를 인덱싱하는 데 사용됩니다.
Document Understanding Solution
버전 1.0.5
릴리스 날짜: 2022년 9월
작성자: AWS
예상 배포 시간: 30~60분