Amazon EMR

Apache Spark, Hadoop, HBase, Presto, Hive ve Diğer Büyük Veri Altyapılarını Kolayca Çalıştırın ve Ölçeklendirin

Amazon EMR, dinamik olarak ölçeklendirilebilen Amazon EC2 bulut sunucularındaki çok miktarda verinin işlenmesini kolay, hızlı ve hesaplı hale getiren bir yönetilen Hadoop altyapısı sağlar. EMR'de Apache Spark, HBase, Presto ve Flink gibi diğer popüler dağıtılmış altyapıları çalıştırarak Amazon S3 ve Amazon DynamoDB gibi diğer AWS veri kaynaklarındaki verilerle de etkileşim kurabilirsiniz. Popüler Jupyter Notebook’u temel alan EMR Notebooks, geçici sorgulama ve keşif analizine yönelik bir yazılım geliştirme ve işbirliği ortamı sunar.

EMR, günlük analizi, web dizini oluşturma, veri dönüştürme işlemleri (ETL), makine öğrenimi, finansal analiz, bilimsel simülasyon ve biyoenformatik dahil olmak üzere çok çeşitli büyük veri kullanım örneklerinin gereksinimlerini de güvenli ve güvenilir bir şekilde karşılar.

An introduction to Amazon EMR (3:00)

Avantajlar

Kullanımı kolay

Dakikalar içinde bir EMR kümesi başlatabilirsiniz. Düğüm tedarik etme, küme kurulumu, Hadoop yapılandırması veya küme ayarlama konusunda endişelenmeniz gerekmez. EMR, sizin analize odaklanabilmeniz için bu görevleri halleder.  Veri bilimciler, yazılım geliştiriciler ve analistler de Jupyter Notebook’u temel alan bir yönetilen ortam olan EMR Notebooks’u kullanarak uygulama oluşturabilir ve meslektaşlarıyla işbirliği yapabilir.

Düşük maliyetli

EMR fiyatlandırması basit ve öngörülebilirdir: En az bir dakikalık bir ücretin üzerine kullandığınız her saniye için bulut sunucusu başına ücret ödersiniz. Saatte yalnızca 0,15 USD karşılığında Hadoop, Spark ve Hive gibi uygulamalar içeren 10 düğümlü bir EMR kümesi başlatabilirsiniz. EMR, Amazon EC2 Spot ve Rezerve Edilmiş Bulut Sunucuları için yerel destek sağladığından, temel bulut sunucularının maliyetinden de %50-80 arası tasarruf sağlayabilirsiniz.

Elastic

EMR ile dilediğiniz ölçekteki verileri işlemek için bir, yüzlerce veya binlerce işlem bulut sunucusu tedarik edebilirsiniz. Bulut sunucusu sayısını manuel olarak ya da Auto Scaling ile kolayca artırıp azaltabilirsiniz ve yalnızca kullandığınız kadar ödersiniz. EMR aynı zamanda işlem bulut sunucuları ile kalıcı depolamayı birbirinden ayırdığından, bunlar bağımsız olarak ölçeklenebilir.

Güvenilir

Kümenizi ayarlamaya veya izlemeye daha az zaman harcayabilirsiniz. Hadoop'u buluta uygun olarak ayarlayan EMR, kümenizi de izleyerek başarısız olan görevleri yeniden dener ve düşük performanslı bulut sunucularınızı otomatik olarak değiştirir. EMR tarafından açık kaynak kodlu yazılımların en son kararlı sürümlerinin sağlanması sayesinde güncellemeleri ve hata düzeltmelerini yönetmenize gerek kalmadığından daha az sorun yaşar ve ortamın bakımını yapmaya daha az çaba harcarsınız.

Güvenli

EMR, bulut sunucularına ağ erişimini denetleyen EC2 güvenlik duvarı ayarlarını otomatik olarak yapılandırır ve kendi tanımladığınız yalıtılmış bir ağ olan Amazon Virtual Private Cloud'da (VPC) küme dağıtabilirsiniz. S3'te depolanan nesneler için EMRFS ile S3 sunucu tarafı şifreleme veya AWS Key Management Service ya da müşteri tarafından yönetilen anahtarlarla Amazon S3 istemci tarafı şifreleme kullanabilirsiniz. Başka şifreleme seçeneklerini ve Kerberos ile kimlik doğrulamasını da kolayca etkinleştirebilirsiniz.

Esnek

Kümeniz üzerinde eksiksiz denetime sahip olursunuz. Her bulut sunucusuna kök erişiminiz vardır, kolayca ek uygulamalar yükleyebilirsiniz ve her kümeyi önyükleme eylemleriyle özelleştirebilirsiniz. Ayrıca, özel Amazon Linux AMI'leriyle EMR kümeleri başlatabilirsiniz.

Kullanım örnekleri

Tıklama akışı analizi

EMR, kullanıcıların segmentlere ayrılması, kullanıcı tercihlerinin anlaşılması ve daha etkili reklamlar sunulması amacıyla tıklama akışı verilerinin analiz edilmesi için kullanılabilir.

Razorfish'in tıklama akışı analizi için EMR'yi nasıl kullandığını öğrenin »

Gerçek zamanlı analiz

EMR'de Spark Streaming ile Amazon Kinesis, Apache Kafka veya diğer veri akışlarından gerçek zamanlı verileri kullanın ve işleyin. Hata toleranslı bir yöntemle akış analizi gerçekleştirin ve sonuçları S3’e veya HDFS'ye yazın.

Hearst'ün Spark Streaming'i nasıl kullandığını öğrenin »

Günlük analizi

EMR, web uygulamaları veya mobil uygulamalar tarafından oluşturulan günlüklerin işlenmesi için kullanılabilir. EMR, müşterilerin petabaytlarca yapılandırılmamış veya yarı yapılandırılmış veriyi, uygulamaları veya kullanıcıları için kullanışlı öngörülere dönüştürmesine yardımcı olur.

Ayıklama dönüştürme yükleme (ETL)

EMR, büyük veri kümeleri üzerinde sıralama, toplama ve birleştirme gibi veri dönüştürme iş yüklerini (ETL) hızlı ve hesaplı bir şekilde çalıştırmak için kullanılabilir.

Redfin'in ETL için nasıl geçici EMR kümeleri kullandığını öğrenin »

Tahmine dayalı analiz

EMR'de Apache Spark, ölçeklenebilir makine öğrenimi algoritmaları için MLlib'i içerir veya kendi kitaplıklarınızı kullanabilirsiniz. Spark, verileri bellek içinde depolayarak yaygın makine öğrenimi iş yükleri için harika performans sağlayabilir.

Intent Media'nın Spark MLib'i nasıl kullandığını öğrenin »

Genomik

EMR, çok yüksek miktarlardaki genomik veriler ve diğer büyük bilimsel veri kümelerini hızla ve verimli bir şekilde yönetmek için kullanılabilir. Araştırmacılar, AWS üzerinde ücretsiz olarak barındırılan genomik verilere erişebilir.

Apache Spark ve Precision Medicine hakkında bilgi edinin »

Örnek olay incelemeleri

AWS'yi kullanmaya başlayın

icon1

AWS hesabı için kaydolun

AWS Ücretsiz Kullanım için anında erişim elde edin.
icon2

10 Dakikalık Öğreticilerle öğrenin

Basit öğreticilerle keşfedin ve öğrenin.
icon3

AWS ile oluşturmaya başlayın

AWS projenizi başlatmanıza yardımcı olacak adım adım kılavuzlarla oluşturmaya başlayın.

Amazon EMR hakkında daha fazla bilgi edinin

Özellik sayfasını ziyaret edin
Oluşturmaya hazır mısınız?
Amazon EMR'yi kullanmaya başlayın
Başka sorunuz mu var?
Bize ulaşın