게시된 날짜: Nov 28, 2023
이제 Amazon EMR 및 Amazon S3 Express One Zone 스토리지 클래스를 사용하여 Apache Spark 애플리케이션의 데이터 처리 및 분석을 S3 Standard의 데이터에 비해 최대 4.0배까지 가속화할 수 있습니다. S3 Express One Zone은 가장 자주 액세스하는 데이터와 지연 시간에 민감한 애플리케이션을 위해 10밀리초 미만의 일관된 데이터 액세스를 제공하도록 특별히 구축된 고성능 단일 가용 영역 스토리지 클래스입니다.
Amazon EMR은 AWS의 페타바이트 규모에 최적화된 오픈 소스 프레임워크의 데이터 처리, 대화형 분석 및 기계 학습을 지원하는 업계 최고의 클라우드 빅 데이터 솔루션입니다. 데이터 레이크 업데이트를 위한 작업 완료 시간 요구 사항과 같이 서비스 수준에 관한 계약(SLA)이 있는 성능 중요 워크로드가 있거나 BI 대시보드 보고서를 위한 빠른 응답 시간이 필요한 경우, EC2 클러스터에서 EMR Spark 애플리케이션을 실행할 때 S3 Express One Zone을 사용하세요.
S3 Express One Zone은 S3 Express One Zone이 제공되는 AWS 리전에서 Amazon EMR 릴리스 6.15.0과 함께 사용할 수 있습니다. 시작하려면 데이터를 S3 Express One Zone 스토리지로 이동하고 Spark 코드의 S3a 커넥터를 사용하여 데이터를 읽고 쓰면 됩니다. S3a는 EMR에서 S3 객체를 처리하는 데 사용하는 커넥터로, S3 Express One Zone 버킷에 필요합니다. 자세한 내용은 Amazon EMR 설명서에서 S3 Express One Zone의 데이터에 EMR 사용을 참조하세요.