Amazon EMR를 사용하면 AWS 클라우드에서 Hadoop을 간편하게 프로비저닝하고 관리할 수 있습니다. 하둡은 여러 배포에서 사용할 수 있으며 Amazon EMR은 Amazon 배포 사용 옵션 또는 하둡용 MapR 배포 사용 옵션 중 선택하여 사용할 수 있도록 합니다.

MapR은 광범위한 미션 크리티컬 및 실시간 운영 용도를 지원하는 입증된 엔터프라이즈급 플랫폼을 통해 하둡에 대한 작업을 할 수 있도록 제공합니다. MapR은 하나의 통합된 빅 데이터 플랫폼에서 하둡, NoSQL 데이터베이스 및 스트리밍 애플리케이션에 유례없는 신뢰성, 사용 편의성 및 최고의 속도를 제공합니다. MapR은 금융 서비스, 소매업, 미디어, 건강 관리, 제조, 전자 통신 및 정부 기관뿐만 아니라 Fortune지 선정 100대 기업 및 Web 2.0 기업에서도 사용되고 있습니다. 투자자는 Lightspeed Venture Partners, Mayfield Fund, NEA 및 Redpoint Ventures입니다. Facebook, LinkedInTwitter에서 MapR의 최신 소식을 확인하십시오.

Amazon EMR 시작하기

무료 계정 생성

대규모의 데이터를 처리해야 하는 경우 요금 할인을 받을 수도 있습니다.

자세한 내용은 AWS에 문의하시기 바랍니다.

mapr-280
  • 즉각적인 복구: MapR M7은 데이터베이스에 높은 가용성을 제공합니다. 노드에 장애가 발생하더라도 몇 초 내에 자동으로 시스템이 복구되므로 이에 영향을 받지 않고 계속하여 애플리케이션을 운영할 수 있습니다.
  • HBase 관리가 필요하지 않음: MapR M7은 사용자가 RegionServers와 같이 개별적인 서비스를 실행하지 않고도 테이블을 활용할 수 있도록 허용합니다. 또한, M7은 압축을 제거하고 원활한 지역 분산을 제공하므로 관리자는 이러한 작업을 수동으로 실행할 필요가 없습니다.
  • 지속적으로 짧은 지연 시간 유지: MapR M7은 성능에 영향을 미치는 불필요한 모음이나 압축이 생기지 않도록 방지하여 지속적으로 지연 시간을 짧게 합니다. 디스크 공간이 보다 작으며 낮은 디스크 I/O 덕분에 데이터베이스 작업이 신속하며 예측 가능합니다.
  • 스냅샷으로 전체 데이터 보호: M7은 HBase에 대한 전체 데이터 보호를 제공합니다. 스냅샷은 테이블의 특정 시점 복구를 활성화하여 사용자 또는 애플리케이션 오류에서 데이터를 보호합니다. M7은 모든 데이터(파일과 테이블 모두)를 포함할 수 있습니다. 스냅샷에서 HBase 테이블을 직접 읽을 수 있으며 다른 배포에서는 HBase를 복원하기 위해 필요한 가동 중지 시간 없이 직접 복구됩니다.
  • 미러링으로 비즈니스 지속성 유지: 미러링을 통해 클러스터 간 실시간으로 차이가 있는 데이터를 자동으로 복제할 수 있습니다. 이를 데이터베이스용 재해 복구 솔루션을 생성하는 데 사용하거나 여러 위치에서의 데이터에 읽기 전용 액세스를 제공하는 데 활용할 수 있습니다. M7은 재구성하는 데 RegionServers가 필요하지 않기 때문에 활성 사이트가 중단되는 경우 미러링된 사이트로 데이터베이스를 즉시 가져올 수 있습니다.
  • NFS: MapR은 임의의 읽기/쓰기 액세스와 표준 NFS 인터페이스를 제공하여 사용자가 클러스터를 마운트하고 표준 파일 기반 애플리케이션을 Linux 유틸리티, 파일 브라우저 및 Java가 아닌 애플리케이션을 비롯한 하둡과 함께 활용할 수 있도록 지원합니다. Amazon EMR에서 MapR을 사용하는 경우 NFS 인터페이스는 /mapr에 사전 마운트됩니다.
  • ODBC: MapR은 표준 ODBC 3.52 사양을 따르는 Hive용 ODBC 드라이버를 제공하여 사용자가 하둡과 함께 모든 BI 도구 또는 SQL 쿼리 빌더를 활용할 수 있도록 합니다. MicroStrategy, Tableau, Excel, Toad를 비롯한 여러 가지 사용 도구와 오픈 소스 도구가 지원됩니다.
  • 배포: MapR이 있는 Amazon EMR은 AWS Management Console, CLI 또는 API를 통해 실행될 수 있는 클러스터의 프로비저닝, 설치, 구성을 자동화합니다.
  • MapR 제어 시스템(MCS): MapR은 하드웨어, 스토리지 및 배포 내 MapReduce와 기타 구성 요소를 비롯하여 하둡에 대한 포괄적인 모니터링 및 관리를 제공합니다.
  • CLI 및 REST API: 모든 MCS 기능은 CLI 및 REST API를 통해서도 노출됩니다. 이를 통해 사용자는 클러스터 정보를 얻고 프로그래밍에 의한 작업을 수행할 수 있습니다. 또한, 타사 및 사용자 지정 모니터링/관리 시스템과도 통합할 수 있습니다.
  • 파일 시스템 고가용성: MapR은 no-NameNode 아키텍처를 제공하므로 자동 장애 조치 및 고장 대치를 통해 동시에 발생하는 여러 개의 장애를 견뎌낼 수 있습니다. 메타데이터는 데이터처럼 분산 및 복제됩니다. no-NameNode이기 때문에 실질적으로 파일의 저장 용량에 대한 제한이 없으며 어떠한 외부 NAS에도 종속되지 않습니다.
  • MapReduce의 고가용성: MapR은 자동 장애 조치 및 고장 대치 기능이 있는 JobTracker HA를 제공합니다. 활성 JobTracker에 장애가 발생하면 자동으로 다른 노드에서 시작되며 모든 작업은 중단 없이 계속 실행됩니다.
  • 데이터 보호: MapR은 특정 시점 복구에 대한 스냅샷을 제공하여 사용자 및 애플리케이션 오류를 복구할 수 있도록 합니다. MapR은 쓰기 시 리디렉션 기술을 통해 변경된 블록에 대한 스냅샷만 생성하여 성능에 영향을 미치지 않도록 방지합니다. 스냅샷은 일관성이 보장되므로, 모든 애플리케이션이 지원됩니다.
  • 재해 복구: MapR은 클러스터 간 미러링을 제공하여 가용 영역 간 재해 복구를 사용할 수 있으며 온프레미스 및 EMR 클러스터가 모두 포함된 하이브리드 배포도 가능합니다. 하이브리드 배포의 경우 EMC Greenplu MR 및 Cisco UCS 어플라이언스를 비롯해 모든 MapR 기반 하둡 배포가 지원됩니다. 변경된 블록만 전송되며 모든 데이터는 자동으로 압축된다는 점에 유의하십시오.
  • 압축: MapR은 이전에 압축되지 않은 모든 데이터를 자동으로 투명하게 압축합니다. 이렇게 하면 디스크 및 네트워크 I/O가 감소하고 성능은 향상됩니다. 수동으로 파일을 압축하거나 압축을 처리하기 위해 애플리케이션을 변경할 필요가 없습니다. 파일 분산 기능과 함께 필요한 블록만 압축 해제되므로 임의의 읽기/쓰기 또한 효율적입니다.
  • 성능: MapR은 디스크 및 네트워크 I/O를 감소하면서도 효율성은 높이고 더 많이 병렬 처리할 수 있는 어드밴스 아키텍처를 탑재하고 있기 때문에 성능에 있어 세계 정상 기록을 보유하고 있습니다.


M7 Edition은 NoSQL 및 하둡 애플리케이션에 대해 사용하기 쉽고 신뢰할 수 있으며 성능적인 혜택을 제공하는 Apache 하둡에 대한 완전한 배포 버전입니다. M7은 조직에서 NoSQL 솔루션의 배포를 고려할 때 직면하게 되는 모순점을 없앴습니다. M7은 압축이나 백그라운드 일관성 확인이 필요하지 않는 아키텍처를 통해 확장이 가능하며 강력한 일관성 및 안정성을 제공하고 지연 시간을 지속적으로 짧게 유지합니다.

M5 Edition 또한 Apache 하둡에 대한 완전한 배포 버전으로, 하둡에서의 모든 파일 작업에 대해 엔터프라이즈급 기능을 제공합니다. 미러링, 스냅샷, NFS HA, 데이터 배치 제어 등 여러 가지 기능이 포함되어 있어 가장 까다로운 미션 크리티컬 환경에 적합합니다.

M3 Edition은 무료로 제공되는 하둡에 대한 완전한 배포 버전입니다. M3 Edition은 업계 표준 인터페이스(예: NFS, ODBC)를 지원하며 관리, 압축 기능 및 성능적 혜택을 제공하는 완전 임의의 읽기-쓰기 가능 플랫폼을 제공합니다.

MapR 기능 M7 Edition M5 Edition M3 Edition
Apache 하둡에 대한 완전 배포
직접 액세스 NFS
제한 없는 확장
세계 최고 기록의 성능
MapR 제어 시스템(MCS)
볼륨 기반 데이터 관리  
No-NameNode 고가용성  
JobTracker 고가용성  
파일 스냅샷  
파일 미러링  
단계적 업그레이드  
HBase 애플리케이션에 대한 즉각적인 복구    
HBase 관리가 필요하지 않음
   
HBase에 대해 지속적으로 짧은 지연 시간 유지    
HBase에 대한 스냅샷    
HBase에 대한 미러링    

EMR Developer Guide에는 AWS Management Console, CLI 또는 API를 사용하여 EMR에서 MapR을 시작하는 방법에 대한 자세한 지침이 포함되어 있습니다. AWS Management Console을 사용하여 MapR 클러스터를 시작하려면

  1. AWS Management Console에서 EMR 서비스에 액세스합니다.
  2. Create New Job Flow를 클릭하여 Create a new Job Flow 마법사를 시작합니다. 이 마법사가 MapR 클러스터를 시작합니다.
  3. 마법사의 Define Job Flow 창에 있는 Hadoop Version 드롭다운 목록에서 MapR M7, M5 또는 M3를 선택합니다.
  4. 마법사의 나머지 단계를 수행해 작업 흐름을 시작합니다.

AWS Premium Support 고객은 EMR에서 사용하는 MapR 관련 문제에 대해 Amazon에 연락할 수도 있습니다.

M5 및 M7 사용자도 support@mapr.com으로 이메일을 보내 MapR 24x7 지원 센터에 직접 문의할 수 있습니다. 모든 MapR 사용자는 언제든 MapR에서 계속 모니터링하는 MapR 포럼에 질문을 올릴 수 있습니다.


Amazon Elastic MapReduce와 Amazon EMR은 Amazon Web Services, Inc. 및 자회사의 상표입니다. All rights reserved.