Amazon EMR

Apache Spark, Hive, Presto 및 다른 빅 데이터 워크로드를 손쉽게 실행하고 크기를 조정

빅 데이터 애플리케이션과 페타바이트 규모의 데이터 분석을 온프레미스 솔루션의 절반 미만의 비용으로 더 빠르게 실행하십시오.

맞춤형 Amazon EC2 클러스터, Amazon EKS, AWS Outposts 또는 Amazon EMR 서버리스에서 실행할 수 있는 옵션과 최신 오픈 소스 프레임워크를 사용하여 애플리케이션을 구축합니다.

성능 최적화 및 오픈 소스 API 호환 버전의 Spark, Hive 및 Presto를 사용하여 최대 2배 더 빠른 인사이트를 얻을 수 있습니다.

EMR Studio의 EMR Notebooks 및 친숙한 오픈 소스 도구를 사용하여 애플리케이션을 쉽게 개발, 시각화 및 디버그할 수 있습니다.

작동 방식

Amazon EMR은 Apache Spark, Apache HivePresto와 같은 오픈 소스 분석 프레임워크를 사용하여 대규모 분산 데이터 처리 작업, 대화형 SQL 쿼리 및 기계 학습(ML) 애플리케이션을 실행하기 위한 클라우드 빅 데이터 플랫폼입니다.

Amazon EMR의 작동 방식
 확대하려면 클릭
EMR Serverless 소개(2:02)
Amazon EMR Serverless 소개
Amazon EMR Serverless는 Amazon EMR의 새로운 옵션입니다. 데이터 엔지니어링 및 분석 작업 시 Apache Spark, Hive 또는 Presto와 같은 오픈 소스 빅 데이터 프레임워크를 사용하여 구축된 애플리케이션을 클러스터 튜닝, 운영, 최적화, 보안 또는 관리 작업 없이 실행할 수 있습니다.
Amazon EMR Serverless 소개
Amazon EMR Serverless는 Amazon EMR의 새로운 옵션입니다. 데이터 엔지니어링 및 분석 작업 시 Apache Spark, Hive 또는 Presto와 같은 오픈 소스 빅 데이터 프레임워크를 사용하여 구축된 애플리케이션을 클러스터 튜닝, 운영, 최적화, 보안 또는 관리 작업 없이 실행할 수 있습니다. EMR Serverless의 컴퓨팅 및 메모리 리소스는 애플리케이션의 필요에 따라 확장 또는 축소되며 애플리케이션에 사용한 리소스에 대한 요금만 부과됩니다.

사용 사례

빅 데이터 분석 수행

통계 알고리즘 및 예측 모델을 사용하여 대규모 데이터 처리 및 가정 분석을 실행하여 숨겨진 패턴, 상관 관계, 시장 동향 및 고객 선호도를 밝혀냅니다.

확장 가능한 데이터 파이프라인 구축

다양한 소스에서 데이터를 추출하고 대규모로 처리하여 애플리케이션과 사용자가 사용할 수 있도록 합니다.

실시간 데이터 스트림 처리

스트리밍 데이터 소스의 이벤트를 실시간으로 분석하여 장기 실행, 고가용성, 내결함성 스트리밍 데이터 파이프라인을 생성합니다.

데이터 과학 및 기계 학습 채택 가속화

Apache Spark MLlib, TensorFlow 및 Apache MXNet과 같은 오픈 소스 기계 학습 프레임워크를 사용하여 데이터를 분석합니다. 대규모 모델 훈련, 분석 및 보고를 위해 Amazon SageMaker Studio에 연결합니다.

시작 방법

Amazon EMR의 작동 방식 알아보기

클러스터 프로비저닝, 리소스 크기 조정, 고가용성 구성 등에 대해 자세히 알아보세요.

Amazon EMR 기능 살펴보기 »

Amazon EMR 요금 살펴보기

Amazon EC2, Amazon EKS, AWS Outposts 또는 Amazon EMR 서버리스에서 EMR 클러스터를 실행하는 옵션으로 초당 지불합니다.

Amazon EMR 요금에 대해 자세히 알아보기 »

Amazon EMR 시작하기

EMR을 사용한 실시간 스트림 처리, 대규모 기계 학습 등에 대해 알아보세요.

Amazon EMR 자습서 확인 »

AWS 자세히 살펴보기