AWS 기반 분석

모든 사용자에 대한 모든 데이터로부터 답변을 얻을 수 있는 가장 빠른 방법
확장 가능한 데이터 레이크
수만의 고객이 AWS에서 데이터 레이크를 실행합니다. 데이터 레이크를 설정하고 관리하기 위해서는 시간 소모적인 많은 수작업이 필요합니다. AWS Lake Formation은 이러한 작업을 자동화하므로 사용자는 몇 달이 아니라 며칠 만에 데이터 레이크를 구축하고 보호할 수 있습니다. 데이터 레이크 스토리지의 경우, Amazon S3는 독보적인 일레븐 나인(11 nine)의 내구성과 99.99%의 가용성 덕분에 데이터 레이크를 구축하기에 가장 좋으며, 개체 수준 감사 로깅 및 액세스 제어를 통한 최상의 보안, 규정 준수, 감사 기능을 제공하고, 5개의 스토리지 계층으로 최고의 유연성을 보여주며, 요금이 가장 저렴합니다(매월 TB당 1 USD 미만부터 시작).
목적별 분석 서비스
AWS는 고유한 분석 사용 사례에 최적화된 가장 광범위하고 가장 심층적인 목적별 분석 서비스 포트폴리오를 제공합니다. 이러한 서비스는 모두 동급 최고로 설계되었습니다. 즉, 사용 시 성능, 규모 또는 요금에서 결코 실망하는 일이 없습니다. 예를 들어, Amazon Redshift는 다른 클라우드 데이터웨어 하우스보다 3배 더 빠르고 50% 이상 저렴합니다. Spark on Amazon EMR은 표준 Apache Spark 3.0보다 1.7배 빠르게 실행되며 기존 온프레미스 솔루션의 절반도 안 되는 비용으로 페타바이트 규모의 분석을 실행할 수 있습니다.
원활한 데이터 이동
데이터 레이크 및 목적별 데이터 스토어의 데이터가 계속 증가하면서, 그 데이터 일부를 한 데이터 스토어에서 다른 데이터 스토어로 쉽게 이동하는 기능이 필요한 경우가 많습니다. AWS를 사용하면 여러 데이터 스토어와 데이터 레이크에서 데이터를 손쉽게 결합, 이동 및 복제할 수 있습니다. 예를 들어, AWS Glue는 분석, 기계 학습, 애플리케이션 개발을 위해 데이터를 손쉽게 검색, 준비 및 결합할 수 있는 포괄적인 데이터 통합 기능을 제공하는 한편, Amazon Redshift는 S3 데이터 레이크에서 데이터를 쉽게 쿼리할 수 있습니다. 이렇게 데이터를 가장 필요한 위치로 규모에 맞게 손쉽게 이동할 수 있게 하는 제공업체는 AWS밖에 없습니다.
통합 거버넌스
최신 분석 아키텍처에서 가장 중요한 부분 중 하나는 고객이 데이터에 대한 액세스 권한을 부여, 관리, 감사할 수 있게 하는 기능입니다. 이는 상당히 어려울 수 있습니다. 조직의 모든 데이터 스토어에서 보안, 액세스 제어 및 감사 추적을 관리하는 일은 복잡하고 시간이 많이 걸리고 오류가 발생하기 쉽기 때문입니다. 중앙식 액세스 제어 및 정책, 데이터의 열 수준 필터링 같은 기능을 갖춘 AWS는 목적별 데이터 스토어와 데이터 레이크의 모든 데이터에 대한 액세스를 관리할 수 있는 거버넌스 기능을 한곳에서 제공하는 유일한 업체입니다.
성능 및 비용 효율성
AWS는 모든 분석 서비스에서 최저 비용으로 최고 성능을 제공하기 위해 최선을 다하고 있으며, 서비스의 가격 대비 성능을 개선하기 위해 계속해서 혁신하고 있습니다. 분석 서비스에 대한 업계 최고의 가격 대비 성능 외에도, S3 지능형 계층화는 고객이 데이터 레이크에 저장된 데이터의 스토리지 비용을 70%까지 절감하게 하며, Amazon EC2는 업계 최고의 200여 개 인스턴스 유형에 대한 액세스, 최대 100Gbps 네트워크 대역폭, 온디맨드/예약/스팟 인스턴스 중에서 선택할 수 있는 기능을 제공합니다.

AWS 분석 서비스

카테고리
사용 사례
AWS 서비스
분석
대화식 분석

Amazon Athena

SQL을 사용해 S3의 데이터를 쿼리합니다.

빅 데이터 처리

Amazon EMR

호스팅된 하둡 프레임워크입니다.

데이터 웨어하우징

Amazon Redshift

빠르고 간단하며 비용 효율적인 데이터 웨어하우징입니다.

실시간 분석

Amazon Kinesis

실시간 비디오 및 데이터 스트림 분석입니다.

운영 분석

Amazon Elasticsearch Service

Elasticsearch 클러스터를 실행 및 확장합니다.

대시보드 및 시각화

Amazon QuickSight

빠른 비즈니스 분석 서비스입니다.

시각적 데이터 준비

AWS Glue DataBrew

최대 80% 더 빠르게 데이터를 정리하고 일반화합니다.

데이터 이동
실시간 데이터 이동

Amazon Managed Streaming for Apache Kafka(MSK)

안전한 완전관리형 고가용성 Apache Kafka 서비스

Amazon Kinesis Video Streams

분석 및 기계 학습을 위해 비디오 스트림을 캡처, 처리 및 저장합니다.

Amazon Kinesis Data Firehose

실시간 데이터 스트림을 준비하여 데이터 스토어 및 분석 도구로 로드합니다.

Amazon Kinesis Data Streams

실시간 분석을 위해 대규모로 스트리밍 데이터를 수집합니다.

데이터 레이크
객체 스토리지

Amazon S3

어디서나 원하는 양의 데이터를 저장하고 검색할 수 있도록 구축된 객체 스토리지입니다.

AWS Lake Formation

안전한 데이터 레이크를 며칠 만에 구축할 수 있습니다.

백업 및 아카이브

Amazon S3 Glacier

클라우드상의 저렴한 아카이브 스토리지입니다.

AWS Backup

AWS 서비스 전체에 걸친 중앙 집중식 백업입니다.

데이터 카탈로그

AWS Glue

데이터를 준비 및 로드합니다.

AWS Lake Formation

안전한 데이터 레이크를 며칠 만에 구축할 수 있습니다.

타사 데이터

AWS Data Exchange

클라우드에서 타사 데이터를 검색하여 구독합니다.

예측 분석 및 기계 학습
프레임워크 및 인터페이스

AWS Deep Learning AMI

Amazon EC2 기반의 딥 러닝입니다.

플랫폼 서비스

Amazon SageMaker

기계 학습 모델을 대규모로 구축, 교육 및 배포합니다.

AWS 분석 서비스

카테고리 사용 사례 AWS 서비스
분석 대화식 분석 Amazon Athena
빅 데이터 처리 Amazon EMR
데이터 웨어하우징 Amazon Redshift
실시간 분석 Amazon Kinesis Data Analytics
운영 분석 Amazon Elasticsearch Service
대시보드 및 시각화 Amazon QuickSight
시각적 데이터 준비 Amazon Glue DataBrew
데이터 이동 실시간 데이터 이동 Amazon Managed Streaming for Apache Kafka (Amazon MSK) | Amazon Kinesis Data Streams | Amazon Kinesis Data Firehose | Amazon Kinesis Video Streams | AWS Glue
데이터 레이크 객체 스토리지 Amazon S3 | AWS Lake Formation
백업 및 아카이브 Amazon S3 Glacier | AWS Backup
데이터 카탈로그
AWS Glue | AWS Lake Formation
타사 데이터 AWS Data Exchange
예측 분석 및 기계 학습 프레임워크 및 인터페이스 AWS Deep Learning AMI
플랫폼 서비스 Amazon SageMaker

사용 사례

Page-Illo_Data-warehousing
데이터 웨어하우징

데이터를 불필요하게 이동할 필요 없이 데이터 웨어하우스 및 데이터 레이크에서 정형 및 비정형 데이터를 대상으로 SQL 및 복잡한 분석 쿼리를 실행합니다.

Amazon Redshift 사용해 보기 »
Page-Illo_Big-data-processing
빅 데이터 처리

데이터 엔지니어링, 데이터 과학 개발 및 협업을 위해 데이터 레이크 또는 온프레미스에서 방대한 양의 데이터를 쉽고 빠르게 처리합니다.

Amazon EMR 사용해 보기 »
Page-Illo_Real-time-analytics
실시간 분석

스트리밍 데이터를 수집, 처리 및 분석하고 데이터 레이크, 데이터 스토어 및 분석 서비스에 직접 데이터 스트림을 로드하여 실시간으로 대응할 수 있습니다.

Amazon MSK 사용해 보기 » Amazon Kinesis 사용해 보기 »
Page-Illo_Data-visualization
운영 분석

애플리케이션 모니터링, 로그 분석 및 클릭스트림 분석을 위해 거의 실시간으로 데이터를 검색, 탐색, 필터링, 집계 및 시각화합니다.

Amazon Elasticsearch Service 사용해 보기 »

고객

JD-Power_Logo_@1x

"1,500개의 서로 다른 체계를 활용하여 Amazon S3에 120TB의 데이터 레이크를 구축했으며, Glue, Redshift, Athena 같은 AWS 분석 서비스를 광범위하게 사용하고 있습니다. 사일로에 묶여 있는 다수의 데이터베이스 및 웨어하우스에서는 이러한 통찰력을 얻지 못했을 것입니다. 우리에게 필요한 것은 S3 규모의 데이터 레이크였습니다.."

- Bernardo Rodriguez
최고 디지털 책임자, J.D. Power

netflix
Chick-fil-A_Logo
3M Company_Logo
280x100_Georgia-Pacific_Logo
Pinterest_Customer-Reference_Logo
TMobile_Logo_@1x
Epic Games
Equinox.svg
Adobe_Customer-Reference_Logo
Pfizer
모든 고객 보기 »

추가 리소스

AWS Data Lab

데이터 및 분석 현대화 이니셔티브를 가속화하는 실질적 결과물을 만듭니다. AWS Data Lab은 빌더와 AWS 기술 리소스로 구성된 팀이 4일간 집중적으로 교류하는 과정입니다.

자세히 알아보기 »