AWS 기반 데이터 레이크 및 분석

모든 사용자에 대한 모든 데이터로부터 답변을 얻을 수 있는 가장 빠른 방법
가장 간편하게 데이터 레이크 및 분석 구축
데이터 레이크를 설정 및 관리하려면 데이터의 로드, 변환, 보안 유지, 데이터 액세스 권한 감사 등 시간이 오래 걸리는 많은 수작업을 수행해야 합니다. AWS Lake Formation은 이러한 다수의 수작업 단계를 자동화하고 성공적인 데이터 레이크를 구축하는 데 소요되는 시간을 수개월에서 며칠 수준으로 줄입니다.
확장성 및 비용 효율성
데이터 볼륨이 기하급수적으로 증가함에 따라 해당 데이터를 저장하고 분석하는 비용도 늘어나고 있습니다. AWS는 모든 데이터를 대규모로 저장 및 분석하는 비용을 손쉽게 관리할 수 있도록 하는 포괄적인 도구를 제공하는데, 여기에는 S3의 데이터 스토리지에 대한 Intelligent Tiering 같은 기능과 Auto Scaling, Savings Plans, EC2 스팟 인스턴스와의 통합 등 컴퓨팅 사용 비용을 절감하는 기능이 포함됩니다.
포괄적이면서 개방적인 서비스
AWS는 업계에서 가장 광범위하고 심층적인 특별히 구축된 분석 도구 포트폴리오를 갖추고 있으므로 고객은 작업에 가장 적합한 도구를 사용하여 데이터에서 통찰력을 신속하게 확인할 수 있습니다. AWS의 모든 분석 서비스에서는 Apache Parquet 같은 개방형 파일 형식을 지원하므로 분석을 위해 데이터를 이동하고 변환할 필요가 없을 뿐 아니라, 표준 형식으로 저장했다가 가장 적합한 도구나 기법을 활용하여 분석할 수 있습니다.
안전한 분석 인프라
방대한 볼륨의 데이터를 보호하는 일은 대부분의 조직이 직면하고 있는 가장 큰 과제 중 하나입니다. AWS는 고객이 기대하는 모든 자격증 및 정책 외에도 고객의 모범 사례 및 업계 규정을 손쉽게 준수할 수 있도록 하는 보안 기능까지 갖추고 있습니다. 예를 들어 AWS Lake Formation은 데이터에 여러 서비스에 걸친 세분화된 액세스 제어를 제공하고, Amazon Macie는 실수로 잘못된 공간에 저장된 중요한 데이터를 찾는 데 도움이 되며, Amazon Inspector를 활용하면 데이터 보안 위반으로 이어질 수 있는 구성 오류를 손쉽게 찾아낼 수 있습니다.

AWS 분석 서비스

카테고리
사용 사례
AWS 서비스
분석
대화식 분석

Amazon Athena

SQL을 사용해 S3의 데이터를 쿼리합니다.

빅 데이터 처리

Amazon EMR

호스팅된 하둡 프레임워크입니다.

데이터 웨어하우징

Amazon Redshift

빠르고 간단하며 비용 효율적인 데이터 웨어하우징입니다.

실시간 분석

Amazon Kinesis

실시간 비디오 및 데이터 스트림 분석입니다.

운영 분석

Amazon Elasticsearch Service

Elasticsearch 클러스터를 실행 및 확장합니다.

대시보드 및 시각화

Amazon QuickSight

빠른 비즈니스 분석 서비스입니다.

데이터 이동
실시간 데이터 이동

Amazon Managed Streaming for Apache Kafka(MSK)

안전한 완전관리형 고가용성 Apache Kafka 서비스

Amazon Kinesis Video Streams

분석 및 기계 학습을 위해 비디오 스트림을 캡처, 처리 및 저장합니다.

Amazon Kinesis Data Firehose

실시간 데이터 스트림을 준비하여 데이터 스토어 및 분석 도구로 로드합니다.

Amazon Kinesis Data Streams

실시간 분석을 위해 대규모로 스트리밍 데이터를 수집합니다.

Amazon Kinesis Data Analytics

실시간으로 스트리밍 데이터에서 실행 가능한 통찰력을 확보합니다.

데이터 레이크
객체 스토리지

Amazon S3

어디서나 원하는 양의 데이터를 저장하고 검색할 수 있도록 구축된 객체 스토리지입니다.

AWS Lake Formation

안전한 데이터 레이크를 며칠 만에 구축할 수 있습니다.

백업 및 아카이브

Amazon S3 Glacier

클라우드상의 저렴한 아카이브 스토리지입니다.

AWS Backup

AWS 서비스 전체에 걸친 중앙 집중식 백업입니다.

데이터 카탈로그

AWS Glue

데이터를 준비 및 로드합니다.

AWS Lake Formation

안전한 데이터 레이크를 며칠 만에 구축할 수 있습니다.

타사 데이터

AWS Data Exchange

클라우드에서 타사 데이터를 검색하여 구독합니다.

예측 분석 및 기계 학습
프레임워크 및 인터페이스

AWS Deep Learning AMI

Amazon EC2 기반의 딥 러닝입니다.

플랫폼 서비스

Amazon SageMaker

기계 학습 모델을 대규모로 구축, 교육 및 배포합니다.

AWS 분석 서비스

카테고리 사용 사례 AWS 서비스
분석 대화식 분석 Amazon Athena
빅 데이터 처리 Amazon EMR
데이터 웨어하우징 Amazon Redshift
실시간 분석 Amazon Kinesis Data Analytics
운영 분석 Amazon Elasticsearch Service
대시보드 및 시각화 Amazon QuickSight
데이터 이동 실시간 데이터 이동 Amazon Managed Streaming for Apache Kafka(Amazon MSK) | Amazon Kinesis Data Streams | Amazon Kinesis Data Firehose | Amazon Kinesis Data Analytics | Amazon Kinesis Video Streams | AWS Glue
데이터 레이크 객체 스토리지 Amazon S3 | AWS Lake Formation
백업 및 아카이브 Amazon S3 Glacier | AWS Backup
데이터 카탈로그
AWS Glue | AWS Lake Formation
타사 데이터 AWS Data Exchange
예측 분석 및 기계 학습 프레임워크 및 인터페이스 AWS Deep Learning AMI
플랫폼 서비스 Amazon SageMaker

사용 사례

Page-Illo_Data-warehousing
데이터 웨어하우징

데이터를 불필요하게 이동할 필요 없이 데이터 웨어하우스 및 데이터 레이크에서 정형 및 비정형 데이터를 대상으로 SQL 및 복잡한 분석 쿼리를 실행합니다.

Amazon Redshift 사용해 보기 »
Page-Illo_Big-data-processing
빅 데이터 처리

데이터 엔지니어링, 데이터 과학 개발 및 협업을 위해 데이터 레이크 또는 온프레미스에서 방대한 양의 데이터를 쉽고 빠르게 처리합니다.

Amazon EMR 사용해 보기 »
Page-Illo_Real-time-analytics
실시간 분석

스트리밍 데이터를 수집, 처리 및 분석하고 데이터 레이크, 데이터 스토어 및 분석 서비스에 직접 데이터 스트림을 로드하여 실시간으로 대응할 수 있습니다.

Amazon MSK 사용해 보기 » Amazon Kinesis 사용해 보기 »
Page-Illo_Data-visualization
운영 분석

애플리케이션 모니터링, 로그 분석 및 클릭스트림 분석을 위해 거의 실시간으로 데이터를 검색, 탐색, 필터링, 집계 및 시각화합니다.

Amazon Elasticsearch Service 사용해 보기 »

고객

JD-Power_Logo_@1x

"1,500개의 서로 다른 체계를 활용하여 Amazon S3에 120TB의 데이터 레이크를 구축했으며, Glue, Redshift, Athena 같은 AWS 분석 서비스를 광범위하게 사용하고 있습니다. 사일로에 묶여 있는 다수의 데이터베이스 및 웨어하우스에서는 이러한 통찰력을 얻지 못했을 것입니다. 우리에게 필요한 것은 S3 규모의 데이터 레이크였습니다.."

- Bernardo Rodriguez
최고 디지털 책임자, J.D. Power

netflix
Chick-fil-A_Logo
3M Company_Logo
280x100_Georgia-Pacific_Logo
Pinterest_Customer-Reference_Logo
TMobile_Logo_@1x
gt-customer_landing_page_graphics166x_epic
Adobe_Customer-Reference_Logo
Pfizer
모든 고객 보기 »

추가 리소스

AWS Data Lab

데이터 및 분석 현대화 이니셔티브를 가속화하는 실질적 결과물을 만듭니다. AWS Data Lab은 빌더와 AWS 기술 리소스로 구성된 팀이 4일간 집중적으로 교류하는 과정입니다.

자세히 알아보기 »

뉴스레터

교육 콘텐츠, 예정된 이벤트 그리고 AWS 분석의 기타 혁신 사항을 계속 받아 보길 원하십니까?

AWS 분석 뉴스레터 구독 »