S: Veri ambarı nedir?

Analiz yaygın bir işlemdir. Hepimiz işlerimizi yönetmek, ilerleme durumumuzu paydaşlara raporlamak ve karar vermeyi desteklemesi amacıyla geçici analizler gerçekleştirmek için raporlar ve panolar kullanırız. Yakından bakıldığında bu raporlar, panolar ve BI araçları, G/Ç’yi minimize etmek ve sorgulama sonuçlarını yüzlerce ve binlerce kullanıcıya eş zamanlı olarak yüksek hızda iletmek için verileri etkili bir şekilde depolayan veri ambarları tarafından desteklenmektedir. İşlemsel veritabanlarının aksine veri ambarları hızlı sorgulama ve veri yükleme performansı için özelleştirilmiş mimariler ve depolama kullanır. Ayrıca, veri ambarları analizleri ve öngörüleri zenginleştirmek için daima daha fazla veri kaynağı ekleyebilmeniz için yüksek oranda ölçeklenebilir olmalıdır. Son olarak, veri ambarları müşterilerin halihazırda sahip oldukları becerileri kullanabilmeleri için üçüncü taraf iş zekası araçları ve SQL istemcileri ile sorunsuz bir şekilde entegre olmalı ve standart SQL’yi desteklemelidir.

S: Neden AWS üzerinde veri ambarı çalıştırmalıyım?

Amazon Redshift hızlı, kullanımı kolay ve tam olarak yönetilen veri ambarı çözümümüzdür. Altyapı tedariğini ve yedekleme, replikasyon ve düzeltme eki uygulama gibi yönetim görevlerini otomatikleştirir. Üçüncü taraf BI ve ETL araçları ile sorunsuz bir şekilde entegre olur, böylece ilk raporunuzu yalnızca birkaç dakika içinde alırsınız. Ayrıca, yükleyebileceğiniz ve analiz edebileceğiniz veri miktarı konusunda hiçbir sınırlama yoktur. Verileriniz arttıkça pahalı sistem yükseltmeleri veya yavaş performans konusunda endişelenmeniz gerekmez. Amazon Redshift, sütunlu depolama ve birtakım optimizasyon teknikleri kullandığından her ölçekte hızlıdır. Amazon Redshift aynı zamanda uygun maliyetlidir; yalnızca kullandığınız kadar ödersiniz. Ana fikir şudur: terabayt başına yılda yalnızca 1000 USD karşılığında sınırsız sayıda kullanıcının verileriniz üzerinde sınırsız analitik gerçekleştirmesini sağlayabilirsiniz. 

S: Amazon Redshift nedir?

Amazon Redshift, hızlı ve tam olarak yönetilen petabayt ölçeğinde bir veri ambarıdır. Tüm verilerinizi mevcut iş zekası araçlarınızı kullanarak analiz etmenizi basitleştirir ve uygun maliyetli hale getirir. Hiçbir taahhüt olmaksızın saatte 0,25 USD fiyatla küçük ölçekte başlayın ve terabayt başına yılda 1000 USD ile geleneksel çözümlerin onda birinden daha düşük fiyata ölçeği petabaytlarca veriye genişletin. Müşteriler genellikle veri boyutunda 3 kat sıkıştırma gözlemler, bu da maliyetlerini sıkıştırılmamış terabayt başına yılda 333 USD’e kadar düşürür.

S: Veri ambarı ve analiz için sunulan çoğu geleneksel veritabanına kıyasla Amazon Redshift’in performansı nasıldır?

Amazon Redshift, çeşitli inovasyonlardan yararlanarak veri ambarı ve analiz iş yükleri için geleneksel veritabanlarından on kata kadar daha yüksek bir performans düzeyine ulaşır:

  • Yüksek düzeyde paralel: Amazon Redshift, gigabaytla eksabayt arasında değişen boyutlara sahip veri kümelerinde hızlı sorgu performansı sunar. Redshift, sorgu gerçekleştirmek için gereken G/Ç miktarını azaltmak amacıyla sütunlu depolama, veri sıkıştırma ve alan eşlemeleri kullanır. Erişilebilir tüm kaynaklardan faydalanmak amacıyla SQL işlemlerini paralelleştirmek ve dağıtmak için yüksek hacimli paralel işleme (MPP) veri ambarı mimarisi kullanır. Temel donanım yüksek performanslı veri işleme için tasarlanmıştır. CPU'lar ve sürücüler arasındaki aktarım hızını en üst düzeye çıkarmak için yerel olarak bağlı depolama ve düğümler arası aktarım hızını en üst düzeye çıkarmak için yüksek bant genişliğine sahip mesh ağı kullanır.
  • Makine öğrenimi: Amazon Redshift, iş yükünüzden ve eş zamanlı kullanımızdan bağımsız olarak yüksek aktarım hızı sağlamak için makine öğrenimini kullanır. Redshift, gelen sorgu çalıştırma süresini tahmin etmek için sofistike algoritmalar kullanır ve en hızlı işlemeyi sağlamak için bu algoritmaları en uygun kuyruğa atar. Örneğin, panolar ve raporlar gibi yüksek eş zamanlılık gerektiren sorgular anında işlenmek üzere bir hızlı kuyruğa yönlendirilir. Eş zamanlılık arttıkça Amazon Redshift kuyruğa almanın ne zaman başlayabileceğini tahmin eder ve küme üzerindeki talep değişkenliğinden bağımsız olarak devamlı hızlı performans sağlamak için Eş Zamanlılık Ölçeklendirmesi özelliğiyle otomatik olarak geçici kaynaklar dağıtır.
  • Sonuç önbelleğe alma: Amazon Redshift, tekrarlanan sorgular için saniyenin altında yanıt süreleri sağlamak adına sonuç önbelleğe alma kullanır. Tekrarlanan sorgu deneyimini yürüten pano, görselleştirme ve iş zekası araçları büyük oranda performans artışı yaşar. Bir sorgu yürütüldüğünde Redshift, önceki çalıştırmalardan önbelleğe alınmış bir sonuç olup olmadığına bakmak için önbelleği arar. Önbelleğe alınmış bir sonuç bulunursa ve veriler değiştirilmediyse, sorguyu yeniden çalıştırmak yerine hemen bu sonuç döndürülür. 

S: Çalışan veri ambarı kümeme nasıl erişebilirim?

Veri ambarı kümeniz erişilebilir hale geldiğinde AWS Management Console’dan ya da Redshift API’lerini kullanarak kümenin uç noktasını ve JDBC ve ODBC bağlantı dizesini alabilirsiniz. Daha sonra bu bağlantı dizesini en sevdiğiniz veritabanı aracı, programlama dili veya İş Zekası (BI) aracıyla kullanabilirsiniz. Çalışmakta olan veri ambarı kümenize yönelik ağ isteklerini yetkilendirmeniz gerekir. Ayrıntılı bir açıklama için lütfen Kullanmaya Başlama Kılavuzumuza başvurun.

S: Amazon Redshift tercih ettiğim iş zekası yazılım paketi ve ETL araçlarıyla uyumlu mudur?

Endüstri standardı SQL kullanan Amazon Redshift’e standart JDBC ve ODBC sürücüleri kullanılarak erişilir. Amazon Redshift özel JDBC ve ODBC sürücülerini KonsolumuzunConnect Client (İstemci Bağlama) sekmesinden indirebilirsiniz. Popüler BI ve ETL satıcılarıyla olan entegrasyonumuzu doğruladık ve bunların bazıları, verilerinizi yükleyip analiz etmeye başlamanıza yardımcı olmak için ücretsiz denemeler sunuyor. Dilerseniz AWS Marketplace’e giderek Amazon Redshift ile çalışacak şekilde tasarlanmış çözümleri dakikalar içinde dağıtıp yapılandırabilirsiniz.

S: Amazon Redshift’i kullanmaya nasıl başlarım?

Amazon Redshift’i ücretsiz olarak deneyebilirsiniz. Daha önce hiç Amazon Redshift kümesi oluşturmadıysanız DC1.Large düğümümüzü 2 ay ücretsiz deneyebilirsiniz. Aylık ücretsiz 750 saat kullanabilirsiniz; bu da 160 GB’lık sıkıştırılmış SSD depolaması kullanarak bir DC1.Large düğümünü sürekli bir şekilde çalıştırmanız için yeterlidir. Ayrıca, daha büyük veri setlerini test etmek için birden fazla düğüm kullanarak kümeler oluşturabilirsiniz. Bu ücretsiz saatlerinizin daha hızlı tükenmesine neden olur. İki aylık deneme süreniz sona erdiğinde veya kullanımınız aylık 750 saati aştığında, herhangi bir ücret ödememek için kümenizi kapatabilir veya standart İsteğe Bağlı Ücretimize tabi olarak çalıştırmaya devam edebilirsiniz.