Genel

Yenilikler sayfasından Amazon Redshift’teki yenilikleri öğrenebilirsiniz.
Daha detaylı bilgiler ve kullanım kılavuzu için Belgeler sayfasını ziyaret edin.

S: Amazon Redshift nedir?

Amazon Redshift, en yaygın kullanılan bulut veri ambarıdır. Bu hizmet, standart SQL ve mevcut İş Zekası (BI) araçlarınızı kullanarak tüm verilerinizi analiz etmenizi hızlandırır, basitleştirir ve uygun maliyetli hale getirir. İleri düzey sorgu optimizasyonu, yüksek performanslı depolarda sütunlu depolama ve yüksek hacimli paralel sorgu yürütmeyi kullanarak terabayt ve petabaytlarca yapılandırılmış ve yarı yapılandırılmış veri üzerinde sofistike analiz sorguları yürütmenize olanak sağlar. Sonuçların çoğu saniyeler içinde döner. Redshift ile hiçbir taahhüt olmaksızın saatte yalnızca 0,25 USD karşılığında küçük ölçekte başlayabilir ve yıllık terabayt başına 1.000 USD ödeyerek geleneksel yerinde çözümlerin onda birinden daha düşük bir fiyata ölçeği petabaytlarca veriye genişletebilirsiniz. Amazon Redshift, Amazon S3 data lake'lerinde bulunan eksabaytlarca yapılandırılmamış veri üzerinde doğrudan SQL sorguları yürütmenizi sağlayan Amazon Redshift Spectrum'u da içerir. Yükleme ya da dönüşüm gerektirmediği gibi Avro, CSV, Grok, Amazon Ion, JSON, ORC, Parquet, RCFile, RegexSerDe, Sequence, Text, Hudi, Delta ve TSV gibi açık veri biçimlerini kullanabilirsiniz. Redshift Spectrum, sorgu işlem kapasitesini alınan verilere göre otomatik olarak ölçeklendirdiğinden, Amazon S3'e yönelik sorgular veri kümesi boyutundan bağımsız olarak hızlı çalışır.

Amazon Redshift, yapılandırılmış veriler üzerinde tanıdık SQL tabanlı istemcileri ve iş zekası (BI) araçları ile standart ODBC ve JDBC bağlantılarını kullanarak hızlı sorgulama özelliklerine sahip olmanızı sağlar. Sorgular birden çok fiziksel kaynağa dağıtılır ve bunlar arasında paralel hale getirilir. Amazon Redshift veri ambarının ölçeğini AWS Management Console’da birkaç tıklamayla ya da tek bir API çağrısı ile büyütüp küçültebilirsiniz. Amazon Redshift, veri ambarınıza otomatik olarak düzeltme eki uygular, ambarı yedekler ve elde edilen yedekleri kullanıcı tarafından tanımlanan bir tutma dönemi boyunca depolar. Amazon Redshift, erişilebilirliği iyileştirmek ve veri dayanıklılığını geliştirmek için çoğaltma ve sürekli yedekleme kullanmasının yanı sıra bileşen ve düğüm hatalarından otomatik olarak kurtarılabilir. Ayrıca, Amazon Redshift, aktarılan ve beklemedeki verileri korumak için AWS IAM entegrasyonu, kimlik federasyonu, sütun düzeyinde erişim kontrolü, Amazon Virtual Private Cloud (Amazon VPC), SSL, AES-256 şifreleme ve entegre AWS KMS entegrasyonu ile sektör lideri güvenliği destekler. Tüm Amazon Redshift güvenlik özellikleri hiçbir ek ücret olmadan dahildir.

Amazon Redshift, tüm Redshift API çağrılarını denetlemenizi sağlamak için AWS CloudTrail ile entegre olur. Redshift bağlantı denemeleri, sorgular ve veri ambarınızda yapılan değişiklikler gibi tüm SQL işlemlerini günlük dosyasına kaydeder. Bu kayıtlara sistem tablolarında SQL sorguları çalıştırarak erişebilir veya günlükleri Amazon S3'teki güvenli bir konuma kaydetmeyi tercih edebilirsiniz. Amazon Redshift SOC1, SOC2, SOC3 ve PCI DSS Level 1 gereksinimlerine uygundur.

Tüm Amazon Web Services hizmetlerinde olduğu gibi peşin yatırım gerekmez ve yalnızca kullandığınız kaynaklar için ücret ödersiniz. Amazon Redshift, kullandıkça ödemenize olanak tanır. Amazon Redshift’i ücretsiz olarak deneme olanağınız bile vardır.

Bölgesel Amazon Redshift erişilebilirliği için bkz. AWS Bölge Tablosu.

S: Şirket içi bir veri ambarı üzerinde neden Amazon Redshift’i kullanayım?

Şirket içi veri ambarları, özellikle de büyük veri kümelerinin yönetilmesi için önemli ölçüde zaman ve kaynak gerektirir. Ayrıca, kendi yönettiğiniz şirket içi veri ambarlarının oluşturulması, bakımının yapılması ve büyütülmesiyle ilişkili finansal maliyet çok yüksektir. Verileriniz büyüdükçe maliyetleri yönetebilmek, ETL karmaşıklığını düşük tutmak ve iyi performans sağlamak amacıyla hangi verileri veri ambarınıza, hangilerini arşive yükleyeceğiniz konusunda sürekli bir denge bulmak zorunda kalırsınız. Amazon Redshift bir veri ambarının maliyetini ve operasyonel iş yükünü önemli ölçüde azaltmakla kalmaz. Redshift Spectrum ile çok miktarda veri, verilerin yüklenmesi gerekmeden, kendi yerel biçiminde kolayca analiz edilebilir.

S: Amazon Redshift için AQUA (Geliştirilmiş Sorgu Hızlandırıcı) nedir?

AQUA, Redshift'in diğer bulut veri ambarlarına kıyasla 10 kata kadar daha hızlı çalışmasını sağlayan dağıtılmış ve donanımsal olarak hızlandırılmış yeni bir önbellektir. Merkezi depolamaya sahip mevcut veri ambarı mimarileri, verilerin işlenmek üzere kümeleri hesaplamak için taşınmasını gerektirir. Veri ambarları önümüzdeki birkaç yıl içinde büyümeye devam ettikçe, tüm bu verileri taşımak için gereken ağ bant genişliği sorgu performansı üzerinde zorluk oluşturur.

AQUA, bulut veri ambarına yeni bir yaklaşım getirmektedir. AQUA, inovatif önbellekte yerinde veri işlemenin önemli bir bölümünü yaparak hesaplama işlemini depolamaya getirir. Ayrıca, geleneksel CPU'ların bugün yapabileceklerinin ötesinde veri işlemeyi hızlandırmak için AWS tasarımlı işlemciler ve bir ölçeklendirme mimarisi kullanır. Daha fazla bilgi edinin ve önizleme için kaydolun.

S: Redshift Spectrum nedir?

Redshift Spectrum, Amazon S3’te bulunan eksabaytlarca yapılandırılmamış veri üzerinde, yükleme veya ETL gerekmeksizin sorgu çalıştırabilmenize olanak sağlayan bir Amazon Redshift özelliğidir. Bir sorgu gönderdiğinizde, bir sorgu planı oluşturup bunu optimize eden Amazon Redshift SQL uç noktasına gider. Amazon Redshift yerel ortamda ve Amazon S3'te bulunan verileri belirler, okunması gereken Amazon S3 verilerini en düşük miktara indirmek üzere bir plan oluşturur ve Redshift Spectrum çalışanlarının paylaşılan bir kaynak havuzu üzerinden Amazon S3'teki verileri okuyup işlemelerini talep eder.

Redshift Spectrum ölçeği gerekli durumlarda binlerce bulut sunucusu içerecek şekilde genişletilebildiğinden, veri boyutu ne olursa olsun sorgular hızlıca çalıştırılabilir. Ayrıca, halihazırda Amazon Redshift sorguları için yaptığınız şekilde, Amazon S3 verileriniz için de tam olarak aynı SQL’i kullanabilir ve aynı BI araçlarınızı kullanarak aynı Amazon Redshift uç noktasına bağlanabilirsiniz. Redshift Spectrum, depolama ve işlem süreçlerini ayırarak her ikisini de birbirinden bağımsız bir şekilde ölçeklendirmenize olanak sağlar. Amazon S3 Data Lake'inizi sorgulamak için ihtiyaç duyduğunuz sayıda, yüksek erişilebilirlik ve sınırsız eş zamanlılık sunan Amazon Redshift kümelerinden kurabilirsiniz. Redshift Spectrum, verilerinizi dilediğiniz yerde ve biçimde, ihtiyaç duyduğunuz anda işlemeye hazır bir şekilde depolama özgürlüğü sunar. Bölgesel Redshift Spectrum erişilebilirliği hakkında bilgi edinmek için lütfen Amazon Redshift fiyatlandırma sayfasını ziyaret edin.

S: AQUA, Redshift Spectrum'u kullanmaktan nasıl farklıdır?

Redshift Spectrum, Amazon S3'de depolanan açık formatlar üzerinden sorgulara izin vermek için tasarlanmıştır. Açık formatlar, Apache Spark'ı destekleyen Amazon EMR veya sunucusuz bir deneyimi destekleyen Amazon Athena dâhil olacak şekilde çoklu altyapılar kullanılarak sorgulanabilir. Redshift Spectrum işlemsel güncellemeleri desteklemez ve Redshift'de alınan verileri depolamak için kullanılan optimize yerel Redshift formatını desteklemez. Redshift Spectrum'u kullanmak harici bir tablonun açık tanımını gerektirirken AQUA yerel Redshift tablolarında çalışır. Spectrum, Redshift kümenizden entegre bir şekilde seyrek verilerde seyrek sorgular yürütmek için harikadır.

AQUA, Redshift'in Redshift veritabanınızın bir parçası olan yüksek hacimli verileri TARAMA ve TOPLAMA yeteneğini hızlandırır. AQUA'dan yararlanırken bile Redshift, işlemler için destek sağlamaya devam eder ve AQUA her zaman son veri üzerinde çalışır.

S: Amazon Redshift ile yönetilen depolama nedir?

Amazon Redshift tarafından yönetilen depolama, RA3 düğüm tipleriyle kullanılabilir ve kümeyi yalnızca hesaplama gereksinimlerinize göre boyutlandırmak üzere bilgisayar ve depolama alanı için bağımsız olarak ölçeklendirmenize ve ödeme yapmanıza olanak tanır. Amazon Redshift, katman-1 önbellek olarak otomatik olarak yüksek performanslı SSD tabanlı yerel depolamayı kullanır ve herhangi bir işlem yapmadan otomatik olarak Amazon S3’e ölçeklendirirken yüksek performans sağlamak için veri bloğu sıcaklığı, veri bloğu yaşı ve iş yükü şablonları gibi optimizasyonlardan yararlanır.

Q: Amazon Redshift’in yönetilen depolamasını nasıl kullanırım?

Zaten Amazon Redshift DS veya DC düğümlerini kullanıyorsanız, yönetilen depolamayı kullanmak için mevcut kümelerinizi yeni işlem bulut sunucusu RA3’e yükseltebilirsiniz. Ayrıca, RA3 bulut sunucusu temelli yeni bir küme oluşturabilirsiniz ve yönetilen depolama otomatik olarak dahil edilir. Bu özelliği kullanmak için başka bir işlem gerekmez.

S: Amazon Redshift veri ambarı yönetimini nasıl basitleştirir?

Amazon Redshift; bir veri ambarı kurmak, işletmek ve ölçeklendirmek için gereken işleri yönetir. Örneğin; altyapı kapasitesinin tedarik edilmesi, yedekleme ve düzeltme eki uygulama gibi devam eden yönetim görevlerinin otomatikleştirilmesi ve hataları gidermek için düğümlerin ve sürücülerin izlenmesi. Otomatik iyileştirme özellikleri de bulunan Redshift, bunun yanı sıra Redshift Advisor'da ambarınızın yönetimine ilişkin önerilerde bulunur. Amazon Redshift, Redshift Spectrum için bilgi işlem altyapısı, yük dengeleme, planlama ve zamanlamanın yanı sıra Amazon S3'te depolanan verilere yönelik sorgularınızı yürütme süreçlerinin tümünü yönetir.

S: Veri ambarı ve analiz için sunulan çoğu yerinde veritabanına kıyasla Amazon Redshift’in performansı nasıldır?

Amazon Redshift, çeşitli inovasyonlardan yararlanarak veri ambarı ve analiz iş yükleri için geleneksel veritabanlarından on kata kadar daha yüksek bir performans düzeyine ulaşır ve şunları içerir:

  • Sütunlu Veri Depolama: Amazon Redshift, verileri bir dizi satır şeklinde depolamaktansa sütunlar halinde düzenler. Sütun tabanlı sistemler, işlemlerin işlenmesi için ideal olan satır tabanlı sistemlerden farklı olarak, sorguların genellikle büyük veri kümeleri üzerinde gerçekleştirilen toplama işlemleri gerektirdiği veri ambarı ve analiz iş yükleri için idealdir. Yalnızca sorgularla ilgili sütunlar işlendiğinden ve sütunlu veriler depolama medyasında sıralı olarak depolandığından, sütun tabanlı sistemler çok daha az G/Ç gerektirerek sorgu performansını önemli ölçüde artırır.
  • Gelişmiş Sıkıştırma: Diskte benzer veriler sıralı olarak depolandığından, sütunlu veri depoları satır tabanlı veri depolarından çok daha fazla sıkıştırılabilir. Amazon Redshift birden çok sıkıştırma tekniği kullanır ve çoğu zaman geleneksel ilişkisel veri depolarına kıyasla önemli bir sıkıştırma oranına ulaşabilir. Boş bir tabloya veri yüklenirken Amazon Redshift otomatik olarak verilerinizden örnek toplar ve en uygun sıkıştırma şemasını seçer.
  • Yüksek Hacimli Paralel İşleme (MPP): Amazon Redshift, veri ve sorgu yükünü otomatik olarak tüm düğümlere dağıtır. Amazon Redshift, veri ambarınıza düğüm eklemeyi kolaylaştırır ve veri ambarınız büyürken hızlı sorgu performansını korumanıza olanak tanır.
  • Redshift Spectrum: Redshift Spectrum, Amazon S3’teki eksabaytlarca veri üzerinde sorgu çalıştırmanızı sağlar. Yükleme veya ETL gerekmez. Verilerinizin hiçbirini Amazon Redshift’te depolamasanız bile Redshift Spectrum’u kullanarak Amazon S3’te depolanan 1 eksabayta kadar boyutlu veri kümelerini sorgulayabilirsiniz. Bir sorgu gönderdiğinizde, bir sorgu planı oluşturan Amazon Redshift SQL uç noktasına gider. Amazon Redshift yerel ortamda ve Amazon S3'te bulunan verileri belirler, okunması gereken Amazon S3 verilerini en düşük miktara indirmek üzere bir plan oluşturur, Redshift Spectrum çalışanlarının paylaşılan bir kaynak havuzu üzerinden Amazon S3'teki verileri okuyup işlemesini talep eder ve geriye kalan işleme için sonuçları Amazon Redshift kümenize geri alır.
  • Gerçekleştirilmiş görünümler: Gerçekleştirilmiş görünümler; panolar, iş zekası (BI) araçlarının sorguları ve ELT (Ayıklama, Yükleme, Dönüştürme) verilerini işleme gibi tekrarlı ve tahmin edilebilir analiz iş yükleri için çok daha hızlı sorgu performansı elde etmenize imkan tanır. Gerçekleştirilmiş görünümleri kullanarak önceden işlenmiş sorgu sonuçlarını saklayabilir ve kaynak tablolarında yapılan en son değişiklikleri aşamalı olarak işleyerek bunları verimli bir şekilde koruyabilirsiniz. Bu noktadan sonra gerçekleştirilmiş görünümlere başvuran sorgular, daha önce hesaplanmış olan sonuçları kullanacağından çok daha hızlı yürütülür. Bunun yanı sıra otomatik yenileme ve sorguyu yeniden yazma özelliklerinin kullanımı, gerçekleştirilmiş görünümlerin kullanımını basitleştirir ve otomatikleştirir. Gerçekleştirilmiş görünümler; filtreler, projeksiyonlar, iç birleşimler, toplamalar, gruplama, işlevler ve diğer SQL yapıları kullanılarak bir veya daha fazla kaynak tabloya dayalı olarak oluşturulabilir.
  • Ölçeklenebilirlik: Yerinde veri ambarlarının işlem ve depolama kapasitesi, yerinde donanımın kısıtlamaları ile sınırlıdır. Redshift, değişen iş yükü gereksinimlerini karşılamak için işlem ve depolamayı gerektiği gibi ölçeklendirebilmenizi sağlar.
  • Otomatik Tablo Optimizasyonu (ATO), manuel çaba göstermeden sıralama ve dağıtım anahtarlarının performans avantajlarından yararlanmanıza yardımcı olan bir kendi kendini iyileştirme özelliğidir. Sorguların tablolarla nasıl etkileşim kurduğunu sürekli olarak gözlemleyen ATO, performansı kümenin iş yüküne dayalı olarak optimize edecek en iyi sıralama ve dağıtım anahtarlarını seçmek için makine öğreniminden yararlanır. Redshift bir anahtarı uygulamanın küme performansını iyileştireceğini belirlerse, yöneticinin müdahalesine gerek kalmadan tablolar birkaç saat içinde otomatik olarak değiştirilir. ATO özelliği tarafından yapılan optimizasyonların, 3 TB ve 30 TB TPC-DS karşılaştırma testlerinde ATO kullanmayan bir kümeye kıyasla küme performansını sırasıyla %24 ve %34 artırdığı görülmüştür. Otomatik Vakum Silme, Otomatik Tablo Sıralama ve Otomatik Analiz gibi ek özellikler de Redshift kümeleri için manuel bakım ve iyileştirme ihtiyacını ortadan kaldırarak hem yeni kümeler hem de üretim iş yükleri için en yüksek performansı sağlar.
  • Kümenizdeki iş yükünü ve kullanım ölçümlerini analiz eden Amazon Redshift Advisor, performansı artırmak ve maliyetleri optimize etmek için özelleştirilmiş önerilerde bulunur. Advisor önerilerini görmek için Amazon Redshift konsolunda oturum açın. Daha fazla bilgi için bkz. Amazon Redshift Advisor'ın önerileriyle çalışma.

S: Amazon Redshift'i kullanmaya nasıl başlarım?

Amazon Redshift ayrıntı sayfasından veya AWS Management Console üzerinden kaydolarak dakikalar içinde kullanmaya başlayabilirsiniz. AWS hesabınız yoksa bir hesap oluşturmanız istenir. Amazon Redshift’i nasıl ücretsiz deneyebileceğinizi öğrenmek için Kullanmaya Başla sayfasını ziyaret edin.

S: Bir Amazon Redshift veri ambarı kümesi oluşturup buna nasıl erişebilirim?

AWS Management Console’u ya da Amazon Redshift API’lerini kullanarak kolayca bir Amazon Redshift veri ambarı kümesi oluşturabilirsiniz. Tek düğümlü, 160 GB boyutlu bir veri ambarıyla kullanmaya başlayabilir ve AWS Console’da birkaç tıklamayla ya da tek bir API çağrısıyla ölçeği petabayt ölçeğine veya onun da üzerine çıkarabilirsiniz.

Değerlendirme veya gelişim/test iş yükleri için en iyi uygunluğa sahip tek düğümlü yapılandırma, Amazon Redshift’i hızla ve uygun maliyetli bir şekilde kullanmaya başlayıp gereksinimleriniz büyüdükçe ölçeği çok düğümlü bir yapılandırmaya büyütmenize olanak tanır. Bir Redshift veri ambarı kümesi, düğüm türüne bağlı olarak 1 ila 128 işlem düğümü içerebilir. En yeni nesil düğüm türü olan RA3 için minimum düğüm sayısı ikidir. Ayrıntılar için lütfen belgelerimize bakın.

Çok düğümlü yapılandırma, istemci bağlantılarını yöneten ve sorguları alan bir baş düğümün yanı sıra verileri depolayıp sorguları ve hesaplamaları gerçekleştiren iki işlem düğümü gerektirir. İşlem düğümü ile aynı boyuta sahip baş düğüm sizin adınıza otomatik olarak tedarik edilir ve bunun için ücret ödemezsiniz.

Tek yapmanız gereken, tercih ettiğiniz Erişilebilirlik Alanı’nı (isteğe bağlı), düğüm sayısını, düğüm türlerini, bir ana adı ve parolayı, güvenlik gruplarını, yedek tutma tercihlerinizi ve diğer sistem ayarlarını belirtmektir. İstediğiniz yapılandırmayı seçtiğinizde, Amazon Redshift gerekli kaynakları tedarik eder ve veri ambarı kümenizin kurulumunu yapar.

Veri ambarı kümeniz erişilebilir hale geldiğinde AWS Management Console’dan ya da Redshift API’lerini kullanarak kümenin uç noktasını ve JDBC ve ODBC bağlantı dizesini alabilirsiniz. Daha sonra bu bağlantı dizesini en sevdiğiniz veritabanı aracı, programlama dili veya İş Zekası (BI) aracıyla kullanabilirsiniz. Çalışmakta olan veri ambarı kümenize yönelik ağ isteklerini yetkilendirmeniz gerekir. Ayrıntılı bir açıklama için lütfen Kullanmaya Başlama Kılavuzumuza başvurun.

S: İşlem düğümü başına maksimum depolama kapasitesi ne kadardır? En uygun performans için işlem düğümü başına önerilen veri miktarı nedir?

RA3, DC veya DS düğüm türlerimizden birini kullanarak bir küme oluşturabilirsiniz. RA3 düğüm türleri işlem ve depolamayı bağımsız olarak ölçeklendirmenize ve bunlar için ödeme yapmanıza olanak sağlar. Performans gereksinimlerinize göre ihtiyacınız olan bulut sunucusu sayısını seçer ve yalnızca kullandığınız yönetilen depolama için ödeme yaparsınız.

RA3 düğüm türleri; RA3.16XL, RA3.4XL ve RA3.XLPLUS olmak üzere üç boyutta sunulmaktadır. Her RA3.16XL düğümü; 48 vCPU, 384 GiB bellek içerir ve 8 GB/sn GÇ’yi destekler. Hem RA3.16XL hem de RA3.4XL kümeleri minimum iki düğümle çalışır ve minimum boyutlu iki düğümlü RA3.16XL veya RA3.4XL kümesi 128 TB yönetilen depolama sunar. Her düğüm için hem RA3.16XL hem de RA3.4XL için yönetilen depolama kotası 64 TB'dir. RA3.16XL kümeleri yönetilen depolamada 8 petabayta kadar küme oluşturmaya olanak sağlayan 128 düğüme kadar ölçekleme yapabilir. Bir RA3.4XL düğümünde 12 vCPU, 96 GiB bellek vardır ve 2 GB/s I/O’yu destekler. RA3.4XL kümeleri, 4 petabayta kadar yönetilen depolama ile küme oluşturmaya olanak sağlayan 64 düğüme kadar ölçekleme yapabilir. Bir RA3.XLPLUS düğümünde 4 vCPU, 32 GiB bellek vardır ve 650 MB/sn G/Ç’yi destekler. RA3.XLPLUS kümeleri, 5 petabayta kadar yönetilen depolama ile küme oluşturmaya olanak sağlayan 32 düğüme kadar ölçekleme yapabilir. Not: Burada belirtilen tüm yönetilen depolama boyutları, sıkıştırılmış veriler içindir. Redshift, verileri 3-4 kata kadar sıkıştırır ve böylece sıkıştırılmamış veri boyutları burada belirtilenden 3-4 kat daha büyük olur.

DC düğüm tipleri artık iki boyutta sunulmaktadır. Büyük seçeneği 160 GB SSD depolama, 2 Intel Xeon E5-2670v2 (Ivy Bridge) sanal çekirdek ve 15 GiB RAM içerir. Bunun 16 katı olan Sekiz Kat Ekstra Büyük, 2,56 TB SSD depolama, 32 Intel Xeon E5-2670v2 sanal çekirdek ve 244 GiB RAM içerir. Saatlik 0,25 USD karşılığında tek bir DC2 Büyük ile çalışmaya başlayabilir ve ölçeği tam 326 TB SSD depolama, 3.200 sanal çekirdek ve 24 TiB RAM içeren 128 8XL’ye kadar genişletebilirsiniz.

Yoğun Depolama (DS) düğüm türleri, Ekstra Büyük ve Sekiz Kat Ekstra Büyük şeklindeki iki boyutta sunulur. Ekstra Büyük (XL) seçeneğinde toplam iki TB manyetik depolama alanına sahip 24 HDD yer alırken, Sekiz Kat Ekstra Büyük (8XL) seçeneğinde toplam 16 TB manyetik depolama alanına sahip 24 HDD vardır. DS2.8XLarge seçeneğinde 36 Intel Xeon E5-2676 v3 (Haswell) sanal çekirdek ve 244 GiB RAM, DS2.XL seçeneğinde ise Intel Xeon E5-2676 v3 (Haswell) sanal çekirdek ve 31 GiB RAM vardır.

Daha fazla ayrıntı için lütfen fiyatlandırma sayfamıza bakın.

S: Hangi durumlarda Amazon RDS yerine Amazon Redshift kullanmalıyım?

Hem Amazon Redshift hem de Amazon RDS, veritabanı yönetim yükünü devrederek geleneksel ilişkisel veritabanları çalıştırmanıza olanak tanır. Müşteriler Amazon RDS veritabanlarını en çok çevrimiçi işlem gerçekleştirme (OLTP) iş yükü için, Redshift’i ise en çok raporlama ve analiz için kullanıyorlar. OLTP iş yükleri; ekleme, güncelleme ve silme gibi işlemler için belirli bilgilerin ve desteğin hızlı bir şekilde sorgulanmasını gerektirir ve en iyi şekilde Amazon RDS tarafından işlenir. Amazon Redshift, birden çok düğümün ölçeğinden ve kaynaklarından yararlanmasının yanı sıra çeşitli optimizasyonlar kullanarak çok büyük veri kümeleri üzerinde analiz ve raporlama iş yükleri için geleneksel veritabanlarına kıyasla performansı bir üst düzeye taşır. Amazon Redshift, verilerinizin boyutu ve sorgularınızın karmaşıklığı arttıkça ya da raporlama ve analiz işlemlerinizin OLTP iş yükünüzün performansını etkilemesini engellemek amacıyla ölçek genişletmek için harika bir seçenek sunar. Artık yeni Birleşik Sorgu özelliği sayesinde, Amazon RDS’iniz veya Aurora veritabanı hizmetlerinizde Amazon Redshift’le kolayca veri sorgulaması yapabilirsiniz.

S: Hangi durumlarda Amazon EMR yerine Amazon Redshift veya Redshift Spectrum kullanmalıyım?

Apache Spark, Hadoop, Presto veya Hbase gibi büyük veri işleme framework’leriyle son derece büyük veri kümelerini işlemek ve analiz etmek için özel kod kullanıyorsanız Amazon EMR’yi kullanmalısınız. Amazon EMR, kümelerinizin yapılandırılması ve kümelerinize yüklediğiniz yazılımlar konusunda tam denetime sahip olmanızı sağlar.

Amazon Redshift gibi veri ambarları, tamamen farklı türde bir analiz için tasarlanmıştır. Veri ambarlarının tasarım amacı, envanter, finans ve perakende satış sistemleri gibi birçok farklı kaynaktan alınan verilerin bir araya toplanmasıdır. Şirket genelinde raporlamanın tutarlı bir şekilde doğru olmasının sağlanması için veri ambarları, verileri yüksek oranda yapılandırılmış bir şekilde depolar. Bu yapı, doğrudan veritabanı tablolarında yerleşik olarak veri tutarlılığı kuralları uygulanmasını sağlar. Amazon Redshift, devasa büyüklükteki yapılandırılmış ve yarı yapılandırılmış veri koleksiyonları üzerinde karmaşık sorgular gerçekleştirmenizi ve son derece hızlı performansa sahip olmanızı gerektiren durumlarda kullanılacak en iyi hizmettir.

Amazon Redshift ve S3’teki veriler üzerinde sorgu çalıştırmak için Redshift Spectrum özelliği harika bir seçenek olsa da genellikle kurumların Amazon EMR gibi işleme framework’lerinden beklediği kullanım örnekleri için pek uygun değildir. Amazon EMR, SQL sorguları çalıştırmanın çok daha ötesine gider. Amazon EMR, tam olarak özelleştirilebilir kümelerde Spark, Hadoop ve Presto gibi popüler büyük veri işleme framework’lerinin en son sürümlerini kullanarak son derece büyük veri kümelerini işlemenize ve analiz etmenize olanak tanıyan, yönetilen bir hizmettir. Amazon EMR ile makine öğrenimi, grafik analizi, veri dönüşümü, veri akışı gibi uygulamalar ve kodunu yazabileceğiniz neredeyse her şey için birçok farklı çeşit ölçeği genişletilebilir veri işleme görevi çalıştırabilirsiniz.

Redshift Spectrum’u EMR ile birlikte kullanabilirsiniz. Redshift Spectrum, tablo tanımlarını depolamak için Amazon EMR ile aynı yaklaşımı kullanır. Redshift Spectrum, verileri ve tablo tanımlarını bulmak için Amazon EMR tarafından kullanılan Apache Hive Metastore’u destekleyebilir. Amazon EMR hizmetini kullanıyorsanız ve zaten bir Hive Metastore’unuz varsa tek yapmanız gereken, Amazon Redshift kümenizi bunu kullanacak şekilde yapılandırmaktır. Daha sonra Amazon EMR i̇şlerinizin yanı sıra bu verileri doğrudan sorgulamaya başlayabilirsiniz. Bundan dolayı, büyük bir veri deposunu kullanmak için zaten EMR hizmetini kullanıyorsanız Redshift Spectrum’u tam olarak bununla aynı anda, Amazon EMR işlerinize engel olmaksızın kullanarak verileri sorgulayabilirsiniz.

Sorgu hizmetleri, veri ambarları ve karmaşık veri işleme framework’leri birbirinden farklıdır ve farklı amaçlar için kullanılır. İş için doğru aracı seçmeniz yeterli.

S: Hangi durumlarda Redshift Spectrum yerine Amazon Athena’yı kullanmalıyım?

Amazon Athena, dilediğiniz çalışana Amazon S3’teki veriler üzerinde anlık sorgular çalıştırma olanağı sağlamanın en basit yoludur. Athena sunucusuz olduğundan kurmanız veya yönetmeniz gereken bir altyapı yoktur. Athena ile verilerinizi hemen analiz etmeye başlayabilirsiniz.

Tutarlı, yüksek oranda yapılandırılmış bir biçimde depolanması gereken, sık erişilen verileriniz varsa Amazon Redshift gibi bir veri ambarı kullanmalısınız. Amazon Redshift’teki yapılandırılmış, sık erişilen verileri depolama ve Redshift Spectrum’u kullanarak Amazon Redshift sorgularınızı Amazon S3 data lake’inizdeki veri evreninin tamamını kapsayacak şekilde genişletme esnekliğine sahip olursunuz. Böylece, verilerinizi dilediğiniz yerde ve biçimde, ihtiyaç duyduğunuz anda işlemeye hazır bir şekilde depolama özgürlüğünüz olur.

S: Amazon EC2’de kendi MPP veri ambarı kümemi çalıştırmak yerine neden Amazon Redshift’i kullanmalıyım?

Amazon Redshift, aşağıdakiler dahil olmak üzere kendi veri ambarınızı yönetmenin getirdiği, zaman alan birçok görevi otomatik olarak yerine getirir:
  • Kurulum: Amazon Redshift ile verilerinizi yükleyip sorgulamaya başlamak için tek yapmanız gereken bir veri ambarı kümesi oluşturma ve şemanızı tanımlamaktır. Sağlama, yapılandırma veya yamalamayı yönetmeniz gerekmez.
  • Veri Dayanıklılığı: Amazon Redshift, verilerinizi veri ambarı kümenizin içinde çoğaltır ve on bir dokuzluk dayanıklılık sağlayacak şekilde tasarlanmış Amazon S3’e sürekli olarak yedekler. Amazon Redshift, her bir sürücüde yer alan verileri kümenizdeki diğer düğümlere yansıtır. Bir sürücü başarısız olursa sorgularınız, Redshift’in replikalardan sürücünüzü yeniden oluşturması sırasında oluşan küçük bir gecikme süresi artışıyla da olsa devam eder. Düğüm hatası söz konusu olduğunda, Amazon Redshift otomatik olarak yeni düğüm tedarik eder ve kümenin içindeki diğer düğümlerden ya da Amazon S3’ten verileri geri yüklemeye başlar. En sık yürütülen sorgularınızın hızla çalışır hale gelmesi için en sık sorguladığınız verilerin geri yüklenmesine öncelik verir.
  • Ölçeklendirme: Kapasite ve performans gereksinimleriniz değiştikçe Amazon Redshift veri ambarı kümenizde tek bir API çağrısıyla veya AWS Management Console’da birkaç tıklamayla düğüm ekleyip kaldırabilirsiniz. Ayrıca Redshift’teki zamanlayıcı özelliğini kullanarak ölçeklendirme ve yeniden boyutlandırma operasyonlarınızı planlayabilirsiniz.
  • Otomatik Güncelleştirme ve Düzeltme Eki Uygulama: Amazon Redshift, yükseltmeleri ve düzeltme eklerini otomatik bir biçimde veri ambarınıza uygulayarak uygulamanızın yönetimine değil, kendisine odaklanmanızı mümkün kılar.
  • Eksabayt Ölçeğinde Sorgu Olanağı: Redshift Spectrum, Amazon S3’teki eksabaytlarca veri üzerinde sorgu çalıştırmanızı sağlar. Yükleme veya ETL gerekmez. Verilerinizin hiçbirini Amazon Redshift’te depolamasanız bile Redshift Spectrum’u kullanarak Amazon S3’te depolanan 1 eksabayta kadar boyutlu veri kümelerini sorgulayabilirsiniz.

Faturalandırma

S: Amazon Redshift kullanımım için hangi ücretleri öderim ve nasıl faturalandırılırım?

Yalnızca kullandığınız kadar ödersiniz ve minimum ücret veya kurulum ücreti yoktur. Amazon Redshift, bir kümeyi duraklatma ve devam ettirme özelliğini destekleyerek müşterilerin küme kullanılmadığında isteğe bağlı faturalandırmayı kolayca askıya almasını sağlıyor. Örneğin; geliştirme için kullanılan bir kümede, kullanılmadığında işlem faturalandırması askıya alınabilir. Küme duraklatıldığında yalnızca küme depolaması için ücretlendirilirsiniz. Rezerve Edilmiş Bulut Sunucuları, kararlı durumdaki üretim iş yükleri için istek üzerine fiyatlandırma ile karşılaştırıldığında önemli ölçüde indirim sağlar.

Bir veri ambarı kümesi, küme erişilebilir olduğu andan itibaren faturalandırılmaya başlanır. Faturalandırma, veri ambarı kümesi sonlandırılana (bulut sunucusu silindiğinde veya başarısız olduğunda gerçekleşebilir) kadar devam eder. Şunlar temel alınarak faturalandırılırsınız:

  • İşlem düğümü saati: İşlem düğümü saatleri, faturalandırma dönemi boyunca tüm işlem düğümlerinizi çalıştırdığınız toplam saat sayısıdır. Veri ambarı kümenizin erişilebilir durumda çalıştığı her saat için faturaya düğüm kullanım saatleri yansıtılır. Veri ambarı kümenizin ücretlendirilmeye devam etmesini istemiyorsanız ek düğüm saatleri karşılığında faturalandırılmamak için kümeyi durdurmanız veya sonlandırmanız gerekir. Tüketilen kısmi düğüm saatleri tam saat olarak faturalandırılır. Faturanıza düğüm başına saatlik 1 birim yansıtıldığından, bir ayın tamamı boyunca aralıksız olarak çalışan 3 düğümlü bir veri ambarı kümesi için 2.160 bulut sunucusu saati faturalandırılır. Baş düğüm saatleri için ücret ödemezsiniz; yalnızca işlem düğümleri ücretlidir.
  • Yönetilen depolama: Yönetilen depolama alanında depolanan veriler için, bölgenize yönelik sabit bir aylık GB ücreti ödersiniz. Yönetilen depolama, RA3 düğüm türleriyle birlikte özel olarak sunulur ve veri boyutundan bağımsız olarak Redshift yönetilen depolama için aynı düşük ücreti ödersiniz. Yönetilen depolama kullanımı, yönetilen depoda bulunan toplam verilere göre saatlik olarak hesaplanır. RA3 kümenizdeki veri miktarını Amazon CloudWatch veya AWS Management Console üzerinden izleyebilirsiniz. RA3 düğümleri ve yönetilen depolama arasındaki veri aktarımları için herhangi bir ücret ödemezsiniz. Yönetilen depolama ücretlerine otomatik ve manuel anlık yedeklerden kaynaklanan yedek depolama ücretleri dahil değildir. Küme sonlandırıldıktan sonra manuel yedeklerinizin tutulması için ücret ödemeye devam edersiniz.
  • Yedek Depolama Alanı: Yedek depolama alanı, veri ambarınız için alınmış anlık yedeklerle ilişkili depolama alanıdır. Yedek tutma dönemini uzattığınızda veya ek anlık yedekler aldığınızda, veri ambarınızın kullandığı yedek depolama alanı artar. Redshift; konsol, API veya CLI kullanırken manuel olarak aldığınız anlık yedekler için ücretlendirme yapar. Redshift’in anlık yedek planlama özelliğinden yola çıkarak oluşturulan Redshift Otomatik’le anlık yedekler almak ücretsizdir. RA3 kümelerinde depolanan veriler, Redshift Yönetilen Depolama'nın (RMS) bir parçasıdır ve RMS ücretleri üzerinden faturalandırılır ancak RA3 kümeleri için manuel olarak alınan anlık yedekler, bu sayfada belirtilen standart Amazon S3 ücretleri üzerinden yedek depolama alanı olarak faturalandırılır. Örneğin, RA3 kümenizde 10 TB veri ve 30 TB manuel anlık yedek olması durumunda 10 TB RMS ve 30 TB yedek depolama alanı için faturalandırılırsınız. Yoğun işlem (DC) ve yoğun depolama (DS) kümelerinde, depolama kümeye dahildir ve ayrı olarak faturalandırılmaz ancak yedekler harici olarak S3'te depolanır. DC ve DS kümelerinde tedarik edilen depolama boyutunu aşan yedek depolama alanı, standart Amazon S3 ücretleri üzerinden yedek depolama alanı olarak faturalandırılır. Anlık yedekler, kümenin duraklatıldığı veya silindiği zaman dahil olmak üzere süresi dolana ya da silinene kadar faturalandırılır.
  • Veri aktarımı: Aynı AWS Bölgesi içinde Amazon Redshift ile Amazon S3 arasında aktarılan veriler için veri aktarımı ücretsizdir. Amazon Redshift’e ve dışarı yapılan diğer tüm veri aktarımları, standart AWS veri aktarımı ücretleri üzerinden faturalanır.
  • Taranan veriler: Redshift Spectrum ile sorgunuzun yürütülmesi için taranan Amazon S3 verilerinin miktarına göre ücret ödersiniz. Sorgu çalıştırmadığınızda Redshift Spectrum için ücret ödemezsiniz. Verilerinizi Parquet veya RC gibi sütunlu bir biçimde depolarsanız, Redshift Spectrum satırların tamamını işlemek yerine yalnızca sorgunun ihtiyaç duyduğu sütunları taradığından maliyetleriniz düşer. Benzer şekilde, verileri Redshift Spectrum tarafından desteklenen biçimlerden birini kullanarak sıkıştırırsanız da maliyetleriniz düşer. Veri depolama için standart Amazon S3 ücretlerini, kullanılan küme içinse Amazon Redshift bulut sunucusu ücretlerini ödersiniz.
  • Eş Zamanlı Ölçeklendirme: Eş Zamanlı Ölçeklendirme sayesinde Redshift, binlerce eş zamanlı kullanıcı ve sorgu olduğunda bile tutarlı olarak hızlı performans sağlamak için otomatik olarak geçici kapasite ekler. Yönetilecek kaynak yoktur, peşin ödeme yapmanız gerekmez ve geçici kümelerin başlatılma veya kapatılma süresi için sizden ücret alınmaz. Ana kümeniz çalışırken, her 24 saatte bir, bir saatlik eş zamanlı ölçeklendirme kümesi kredisi biriktirebilirsiniz. Ücretsiz kredileri aşan kullanımlarda, bir eş zamanlı ölçeklendirme kümesi için isteğe bağlı olarak saniyelik ücret ödersiniz. Bu ücret yalnızca kümenin sorgularınızı işlediği zaman için yansıtılır. Eş Zamanlı Ölçeklendirme kümesi her etkinleştirildiğinde en az bir dakikalık ücret uygulanır. İstek üzerine saniyelik ödenen ücret, Amazon Redshift kümenizdeki düğümlerin türüne ve sayısına bağlıdır.

Aksi belirtilmediği sürece fiyatlarımıza KDV ve ilgili satış vergileri gibi, yürürlükte olan vergiler ve harçlar dahil değildir. Fatura adresi Japonya'da olan müşteriler için AWS hizmetlerinin kullanımı Japonya Tüketim Vergisine tabidir. Daha fazla bilgi edinin.

Amazon Redshift fiyatlandırma bilgileri için lütfen Amazon Redshift fiyatlandırma sayfasını ziyaret edin.

Veri entegrasyonu ve yükleme

S: Amazon Redshift veri ambarıma nasıl veri yükleyebilirim?

Amazon Redshift’e Amazon S3, Amazon RDSAmazon DynamoDB, Amazon EMR, AWS Glue, AWS Data Pipeline gibi çeşitli veri kaynaklarından veya Amazon EC2’deki ya da şirket içindeki başka herhangi bir SSH özellikli konaktan veri yükleyebilirsiniz. Amazon Redshift, veri ambarı kümenize veri alma hızını en üst düzeye çıkarabilmeniz için verilerinizi paralel olarak her işlem düğümüne yüklemeye çalışır. İstemciler ODBC veya JDBC kullanarak Amazon Redshift’e bağlanabilir ve 'insert' SQL komutları çalıştırarak veri ekleyebilir. S3 veya DynamoDB tarafından yöntemler her işlem düğümüne paralel olarak yüklenirken SQL ekleme bildirimlerinin tek bir baş düğüm aracılığıyla yüklenmesi nedeniyle bunun daha yavaş olduğunu lütfen unutmayın. Verileri Amazon Redshift’e yükleme konusunda daha ayrıntılı bilgi edinmek için lütfen Kullanmaya Başlama Kılavuzumuza bakın.

S: Mevcut Amazon RDS, Amazon EMR, Amazon DynamoDB ve Amazon EC2 veri kaynaklarımdan Amazon Redshift’e nasıl veri yükleyebilirim?

COPY komutumuzu kullanarak Amazon EMR, Amazon DynamoDB veya SSH özellikli herhangi bir konaktan doğrudan Amazon Redshift’e paralel olarak veri yükleyebilirsiniz. Redshift Spectrum, basit bir INSERT INTO komutuyla Amazon S3’ten kümenize veri yüklemenize de olanak tanır. Bu sayede, kümenize Parquet ve RC gibi farklı biçimlerden veri yükleyebilirsiniz. Bu yaklaşımı kullanmanız durumunda Amazon S3’ten taranan veriler için Redshift Spectrum ücretleri uygulanacağını unutmayın. 

Ayrıca, birçok ETL şirketi, sunduğu araçlarla kullanım konusunda Amazon Redshift'e sertifika vermiştir ve bunların bazıları, verilerinizi yüklemeye başlamanıza yardımcı olmak için ücretsiz deneme sunar. AWS Data Pipeline, Amazon RDS ve Redshift gibi çeşitli AWS veri kaynaklarından veri yüklemeye yönelik yüksek performanslı, güvenilir, hata toleranslı bir çözüm sağlar. AWS Data Pipeline’ı kullanarak veri kaynağını, istenen veri dönüşümlerini belirtebilir, sonra da önceden yazılmış bir içeri aktarma betiğini kullanarak verilerinizi Amazon Redshift’e yükleyebilirsiniz. Ayrıca, AWS Glue, müşterilerin verilerini analitik için hazırlamalarını ve yüklemelerini kolaylaştıran, tam olarak yönetilen bir ayıklama, dönüştürme ve yükleme hizmetidir. AWS Management Console’da birkaç tıklama ile AWS Glue ETL işleri oluşturup bunları çalıştırabilirsiniz.

S: Başlangıçta Amazon Redshift’e yüklenmesi gereken çok verim var. İnternet üzerinden aktarmam uzun sürer. Bu verileri nasıl yükleyebilirim?

AWS Snowball'u kullanarak taşınabilir depolama cihazları üzerinden Amazon S3'e veri aktarabilirsiniz. Ayrıca, AWS Direct Connect'i kullanarak ağınız ya da veri merkeziniz ile AWS arasında özel bir ağ bağlantısı kurabilirsiniz. Verilerinizi aktarmak için 1 Gbit/sn veya 10 Gbit/sn bağlantı noktalarından birini seçebilirsiniz.

Güvenlik

S: Amazon Redshift, veri kaynağımı nasıl güvenli tutar?

Amazon Redshift, entegre AWS IAM entegrasyonu, tek oturum açma için kimlik federasyonu (SSO), çok faktörlü kimlik doğrulama, sütun düzeyinde erişim kontrolü, Amazon Virtual Private Cloud (Amazon VPC) ile sektör lideri güvenliği destekler ve taşıma sırasında ve beklemedeyken verilerinizi korumak için entegre AWS KMS entegrasyonu sağlar. Amazon Redshift, endüstri standardı şifreleme tekniklerini kullanarak verilerinizi şifreler ve hem aktarım hem bekleme sırasında güvenli tutar. Amazon Redshift, aktarım sırasında verilerin güvenli tutulması için istemci uygulamanızla Redshift veri ambarı kümeniz arasında SSL özellikli bağlantıları destekler. Verilerinizin beklerken güvenli tutulması için Amazon Redshift tarafından veriler diske yazılırken donanım hızlandırmalı AES-256 kullanılarak her bir blok şifrelenir. Bu işlemler, ara sorgu sonuçları dahil olmak üzere diske yazılan her şeyi şifreleyen G/Ç alt sisteminin düşük bir düzeyinde gerçekleşir. Bloklar olduğu gibi yedeklendiğinden, yedekler de şifreli olur. Amazon Redshift varsayılan olarak anahtar yönetimini üstlenir ancak anahtarlarınızı AWS Key Management Service aracılığıyla yönetmeyi tercih edebilirsiniz. Tüm Amazon Redshift güvenlik özellikleri hiçbir ek ücret olmadan sunulur. Redshift Spectrum, kendi hesabınızın AWS Key Management Service (KMS) tarafından yönetilen varsayılan anahtarını kullanarak Amazon S3’ün Sunucu Tarafı Şifreleme (SSE) özelliğini destekler.

S: Redshift, sütun düzeyinde güvenlik gibi ayrıntılı erişim kontrollerini destekliyor mu?

Evet. Ayrıntılı sütun düzeyi güvenlik denetimleri, kullanıcıların yalnızca erişimi olması gereken verileri görmesini sağlar. Amazon Redshift, yerel tablolar için sütun düzeyinde erişim kontrolünü destekler ve böylece bir kullanıcıya veya kullanıcı grubuna sütun düzeyinde ayrıcalıklar vererek/bunları iptal ederek tablonun veya görünümün her bir sütununa erişimi kontrol edebilirsiniz. Redshift, AWS Lake Formation ile entegre olarak Lake Formation'ın sütun düzeyi erişim denetimlerinin data lake'teki verilerde yürütülen Redshift sorgularına da uygulanmasını sağlar.

S: Amazon Redshift, veri maskelemeyi veya verileri belirtece dönüştürmeyi destekler mi?

Amazon Lambda kullanıcı tanımlı işlevleri (UDF), bir AWS Lambda işlevini Amazon Redshift'te bir UDF olarak kullanmanıza ve bunu Redshift SQL sorgularından çağırmanıza olanak tanır. Bu işlevsellik, diğer hizmetlerle veya üçüncü taraf ürünlerle daha sıkı entegrasyon sağlamak üzere SQL sorgunuz için özel uzantılar yazmanızı sağlar. Protegrity gibi satıcılarla entegrasyon kurarak verilerin harici olarak belirtece dönüştürülmesini, maskelenmesini, tanımlanmasını veya kimlik bilgilerinden arındırılmasını mümkün kılmak, ayrıca hassas verileri her kullanıcının izinlerine ve gruplarına bağlı olarak sorgu anında koruma altına almak ya da korumadan çıkarmak için Lambda UDF'leri yazabilirsiniz.

S: Redshift, çoklu oturum açmayı destekliyor mu?

Evet. Microsoft Azure Active Directory, Active Directory Federation Services, Okta, Ping Federate veya diğer SAML uyumlu kimlik sağlayıcıları gibi kurumsal kimlik sağlayıcılarını kullanmak isteyen müşteriler, Amazon Redshift’i tek oturum açma sağlayacak şekilde yapılandırabilir.

S: Redshift, Microsoft Azure Active Directory ile tek oturum açmayı nasıl destekler?

Microsoft Azure Active Directory (AD) kimlikleriyle Amazon Redshift kümesinde oturum açabilirsiniz. Bu, Redshift’te Azure Active Directory kimliklerini çoğaltmadan Redshift’te oturum açabilmenizi sağlar.

S: Amazon Redshift, çok faktörlü kimlik doğrulamayı (MFA) destekliyor mu?

Evet. Amazon Redshift kümenizde kimlik doğrulaması yaparken ek güvenlik için çok faktörlü kimlik doğrulamayı (MFA) kullanabilirsiniz.

S: Amazon Redshift’i Amazon Virtual Private Cloud’da (Amazon VPC) kullanabilir miyim?

Evet, Amazon Redshift’i VPC yapılandırmanızın bir parçası olarak kullanabilirsiniz. Amazon VPC ile kendi veri merkezinizde çalıştırabileceğiniz geleneksel bir ağa çok benzeyen bir sanal ağ topolojisi tanımlayabilirsiniz. Bu sayede Amazon Redshift veri ambarı kümenize kimlerin erişebileceği konusunda tam denetime sahip olursunuz. Redshift Spectrum’u VPC’nizin parçası olan bir Amazon Redshift kümesi ile kullanabilirsiniz.

S: Amazon Redshift işlem düğümlerime doğrudan erişebilir miyim?

Hayır. Amazon Redshift işlem düğümleriniz özel bir ağ alanındadır ve bunlara yalnızca veri ambarı kümenizin baş düğümünden erişilebilir. Bu mekanizma, verileriniz için ek bir güvenlik katmanı sağlar.

Erişilebilirlik ve dayanıklılık

S: Bir düğümümdeki sürücülerden biri başarısız olursa veri ambarı kümemin erişilebilirliği ve veri dayanıklılığı bundan nasıl etkilenir?

Amazon Redshift, veri ambarı kümenizde başarısız olan düğümü otomatik olarak algılayıp değiştirir. Yedek bir düğüm tedarik edilip veritabanına eklenene kadar veri ambarı kümesi sorgulara ve güncelleştirmelere kapalı olur. Amazon Redshift, yedek düğümünüzü anında erişilebilir hale getirir ve verilerinizi olabildiğince hızlı bir şekilde sorgulamaya başlayabilmeniz için S3’ten önce en sık erişilen verileri yükler. Tek düğümlü kümeler veri replikasyonunu desteklemez. Bir sürücünün başarısız olması durumunda kümeyi S3’teki anlık yedekten geri yüklemeniz gerekir. Üretim için en az iki düğüm kullanılmasını öneririz.

S: Tek bir düğüm başarısız olursa veri ambarı kümemin erişilebilirliği ve veri dayanıklılığı bundan nasıl etkilenir?

Amazon Redshift, veri ambarı kümenizde başarısız olan düğümü otomatik olarak algılayıp değiştirir. Yedek bir düğüm tedarik edilip veritabanına eklenene kadar veri ambarı kümesi sorgulara ve güncelleştirmelere kapalı olur. Amazon Redshift, yedek düğümünüzü anında erişilebilir hale getirir ve verilerinizi olabildiğince hızlı bir şekilde sorgulamaya başlayabilmeniz için S3’ten önce en sık erişilen verileri yükler. Tek düğümlü kümeler veri replikasyonunu desteklemez. Bir sürücünün başarısız olması durumunda kümeyi S3’teki anlık yedekten geri yüklemeniz gerekir. Üretim için en az iki düğüm kullanılmasını öneririz.

S: Veri ambarı kümemin Erişilebilirlik Alanı'nda (AZ) bir kesinti yaşanırsa veri ambarı kümemin erişilebilirliği ve veri dayanıklılığı bundan nasıl etkilenir?

Amazon Redshift veri ambarı kümenizin Erişilebilirlik Alanı erişilemez hale gelirse, Amazon Redshift hiçbir veri kaybı veya uygulama değişikliği yaşanmadan kümenizi otomatik olarak başka bir AWS Erişilebilirlik Alanı'na (AZ) taşır. Bunu aktifleştirmek için kümenizin yapılandırma ayarlarında taşınma özelliğini etkinleştirmeniz gerekir.

S: Amazon Redshift, Multi-AZ Dağıtımları destekler mi?

Amazon Redshift şu an yalnızca Single-AZ dağıtımları destekler. Aynı Amazon S3 giriş dosyalarından ayrı AZ’lerdeki iki Amazon Redshift veri ambarı kümesine veri yükleyerek birden çok AZ'de veri ambarı kümesi çalıştırabilirsiniz. Redshift Spectrum ile farklı AZ’lerde birden çok küme başlatabilir ve Amazon S3’teki verileri kümenize yüklemenize gerek kalmadan bunlara erişebilirsiniz. Ayrıca, bir veri ambarı kümesini, veri ambarı kümesi anlık yedeklerinizden farklı bir AZ’ye yükleyebilirsiniz.

Yedekleme ve geri yükleme

S: Amazon Redshift, verilerimi nasıl yedekler? Kümemi bir yedekten nasıl geri yükleyebilirim?

Amazon Redshift, yüklendiğinde veri ambarı kümenizdeki tüm verileri çoğaltmasının verilerinizi yanı sıra sürekli olarak Amazon S3’te yedekler. Amazon Redshift, her zaman verilerinizin en az üç kopyasını (işlem düğümlerinde özgün kopya ve replika, Amazon S3’te bir yedek) tutmaya çalışır. Redshift olağanüstü durum kurtarma için anlık yedeklerinizi zaman uyumsuz olarak bir başka bölgedeki S3'e de çoğaltabilir.

Amazon Redshift varsayılan olarak veri ambarı kümeniz için 1 günlük bir tutma dönemiyle otomatik yedeklemeyi etkinleştirir. Bu süre 35 güne kadar uzayacak şekilde yapılandırılabilir.

Ücretsiz yedek depolama alanı, veri ambarı kümesindeki düğümlerin toplam depolama boyutuyla sınırlıdır ve yalnızca etkin veri ambarı kümeleri için geçerlidir. Örneğin, toplam 8 TB veri ambarı depolama alanınız varsa ücretsiz olarak en fazla 8 TB yedek depolama alanı sağlarız. Yedeklerinizin tutulma süresini bir günden uzun yapmak istiyorsanız AWS Management Console ya da Amazon Redshift API’lerini kullanarak bunu yapabilirsiniz. Otomatik anlık yedekler hakkında daha fazla bilgi edinmek için lütfen Amazon Redshift Yönetim Kılavuzu’na bakınız. Amazon Redshift yalnızca değişen verileri yedeklediğinden, çoğu anlık yedek ücretsiz depolama alanınızın küçük bir miktarını kullanır.

Bir yedeği geri yüklemeniz gerektiğinde, yedek tutma aralığınız içinde tüm otomatik yedeklere erişebilirsiniz. Geri yüklenecek yedeği seçtiğinizde, yeni bir veri ambarı kümesi tedarik eder ve verilerinizi buna geri yükleriz.

S: Otomatik yedeklerimin ve anlık yedeklerimin tutulduğu süreyi nasıl yönetirim?

Otomatik yedeklerinizin tutulduğu süreyi AWS Management Console veya ModifyCluster API'si ile RetentionPeriod parametresini değiştirerek yönetebilirsiniz. Otomatik yedeklemeyi tamamen kapatmak istiyorsanız tutma dönemini 0 değerine ayarlayabilirsiniz (önerilmez).

S: Veri ambarı kümemi silersem yedeklerime ne olur?

Bir veri ambarı kümesini sildiğinizde, silme işleminin üzerine son bir anlık yedeğin oluşturulup oluşturulmayacağını belirtme olanağınız vardır. Bu, silinen veri ambarı kümesinin daha sonra geri yüklenmesine olanak sağlar. Veri ambarı kümenizin daha önce manuel olarak oluşturulmuş tüm anlık yedekleri korunur ve bunları silmediğiniz sürece standart Amazon S3 fiyatları üzerinden faturalandırma devam eder.

Ölçeklenebilirlik

S: Amazon Redshift veri ambarı kümemin boyutunu ve performansını nasıl ölçeklendirebilirim?

Sorgu performansını artırmak veya fazla CPU, bellek ya da G/Ç kullanımına yanıt vermek istiyorsanız AWS Management Console veya ModifyCluster API’si aracılığıyla Esnek Yeniden Boyutlandırma’yı kullanarak veri ambarı kümenizdeki düğümlerin sayısını artırabilirsiniz. Veri ambarı kümenizi değiştirdiğinizde istediğiniz değişiklikler anında uygulanır. Amazon Redshift veri ambarı kümenize yönelik işlem kullanımı, depolama kullanımı ve okuma/yazma trafiğine ilişkin ölçümlere AWS Management Console veya Amazon CloudWatch API'leri aracılığıyla ücretsiz olarak erişebilirsiniz. Amazon CloudWatch özel ölçüm işlevi aracılığıyla, kullanıcı tarafından tanımlanmış başka ölçümler ekleyebilirsiniz.

Eş Zamanlı Ölçeklendirme özelliği sayesinde neredeyse sınırsız sayıda kullanıcıyı ve eş zamanlı sorguyu, sürekli hızlı sorgu performansıyla destekleyebilirsiniz. Eş zamanlı ölçeklendirme etkinleştirilince, eş zamanlı okuma sorgularındaki bir artışı işlemek için ihtiyacınız olduğunda Amazon Redshift otomatik olarak ek küme kapasitesi ekler.

Redshift Spectrum ile Amazon S3’te depolanan aynı verilere erişen birden çok Amazon Redshift kümesi çalıştırabilirsiniz. Farklı kullanım örnekleri için farklı kümeler kullanabilirsiniz. Örneğin, bir kümeyi standart raporlama için kullanırken başka bir kümeyi veri bilimi sorguları için kullanabilirsiniz. Pazarlama ekibiniz, operasyon ekibinizin kümelerinden farklı olarak kendi kümelerini kullanabilir. Redshift Spectrum, Amazon S3’ten gelen verileri okumak ve işlemek için sorgunuzun yürütülmesini otomatik olarak paylaşılan bir kaynak havuzundan birkaç Redshift Spectrum çalışanına dağıtır ve kalan işlemler için sonuçları tekrar Amazon Redshift kümenize çeker.

S: Ölçeklendirme sırasında veri ambarı kümem erişilebilir kalır mı?

Duruma bağlı. Eş Zamanlı Ölçeklendirme özelliği kullanılırken eş zamanlı ölçeklendirme esnasında küme, okuma ve yazma için tam olarak erişilebilir durumdadır. Esnek yeniden boyutlandırma ile dört ila sekiz dakika süren yeniden boyutlandırma esnasında küme erişilebilir olmaz. Yönetilen depolamada Redshift RA3 depolama esnekliğiyle küme tam olarak erişilebilirdir ve veriler, yönetilen depolama ile işlem düğümleri arasında otomatik olarak taşınır.

S: Amazon Redshift veri paylaşımı nedir?

Amazon Redshift veri paylaşımı, canlı verileri Redshift üzerinde paylaşmanın güvenli ve kolay bir yolunu mümkün kılar. Kopyalama veya taşıma ihtiyacı olmadan herhangi bir Redshift kümesindeki verilere anında, ayrıntılı ve yüksek performanslı erişim imkânı sunarak kuruluşların çevikliğini arttıran veri paylaşımı, verilere canlı erişim sağlayarak kullanıcıların en güncel ve tutarlı bilgileri, kümede güncellendikleri anda görmesine olanak tanır. Veri paylaşımı sayesinde yeni analiz iş yüklerini hızlıca devreye alabilir, bir yandan ortak veri kümelerine erişim izni verirken bir yandan da iş yükünüze özgü performans SLA'larınızı karşılamak üzere bunları yalıtılmış işlem kaynaklarıyla tedarik edebilirsiniz. Sadece kuruluş içinde veri paylaşmayla sınırlı kalmayan veri paylaşımı, kuruluşlar arasında ve harici taraflarla güvenli ve yönetilen iş birliğine de olanak tanır. Veri paylaşımı için yaygın kullanım örneklerinden bazıları şunlardır: okuma iş yüklerinin yalıtılması ve ilgili departmanla ilişkilendirilmesi amacıyla verileri çok sayıda BI kümesiyle paylaşmak üzere merkezi bir ETL kümesi oluşturmak, hizmet olarak veri modeliyle çalışmak ve verileri harici müşterilerle paylaşmak, aynı kuruluştaki birden fazla iş grubunun farklılaştırılmış öngörüler kazanmak için veriler üzerinde paylaşım ve iş birliği yapması ve geliştirme, test ve üretim ortamları arasında veri paylaşımı yapmak. Daha fazla bilgi edinmek ve kullanmaya başlamak için Redshift belgelerini ziyaret edin.  

S: Redshift'te veritabanları arası sorgu nedir?

Veritabanları arası sorgular sayesinde hangi veritabanına bağlı olduğunuz fark etmeksizin, erişim sahibi olduğunuz herhangi bir Redshift veritabanını kolayca sorgulayabilir ve aldığınız verileri birleştirebilirsiniz. Hem kümede yerel olarak bulunan veritabanları hem de uzak kümelerden erişime açılmış paylaşılan veri kümeleri buna dahil olabilir. Veritabanları arası sorgular size çok kiracılı yapılandırmaları desteklemek üzere verileri ayrı veritabanlarında organize etme esnekliği sunar.

S: Müşteriler eş zamanlı ölçeklendirmeyi ve veri paylaşımını hangi durumlarda kullanmalıdır?

Veri paylaşımı ve eş zamanlı ölçeklendirme, birbirini tamamlayan özelliklerdir. Eş zamanlı ölçeklendirme sayesinde Redshift, tek bir kümedeki bir veya birden fazla iş yükünü otomatik bir şekilde ölçeklendirerek yüksek eş zamanlılığın ve ani sorgu artışlarının altından kalkmanızı sağlar. Redshift, kullanıcı etkinliğindeki ani artışların üstesinden gelmek için kapasiteyi saniyeler içinde esnek ve otomatik bir biçimde artırır ve etkinlikler azaldığında tekrar düşürür. Uygulamalar Redshift ile tek bir uygulama uç noktası kullanarak etkileşim kurmaya devam eder. Veri paylaşımı, çeşitlilik içeren iş yüklerini birden fazla küme ve birden fazla hesap içeren dağıtımlarla ölçeklendirmenize olanak tanır. Bu özellik iş yüklerinin yalıtılmasını ve ilgili departmanla ilişkilendirilmesini, merkezi olmayan ortamlarda gruplar arası iş birliğini ve hem dahili hem de harici paydaşlara hizmet olarak veri modeliyle hizmet sağlama kabiliyetini mümkün kılar. Eş zamanlı ölçeklendirmeyi hem veri paylaşımı üretici kümelerinde hem de tüketici kümelerinde etkinleştirebilirsiniz.

Eş Zamanlılık

S: Redshift kümemin eş zamanlılığın yüksek olduğu anlarda bile tutarlı bir şekilde hızlı performans sunacağından emin olmak için kaynaklarımı nasıl yönetmeliyim?

Normal bir veri ambarında eş zamanlı olarak kullanılan sorgu miktarı gün içinde büyük ölçüde değişiklik gösterir. En yüksek talebe göre kaynak sağlamaktansa, yalnızca gerekli aralıklar için kaynak eklemek daha uygun maliyetlidir. Amazon RedShift, bunu sizin için otomatik olarak halleder.

Eş Zamanlı Ölçeklendirme, binlerce eş zamanlı sorgu söz konusu olduğunda dahi tutarlı olarak hızlı sorgu performansı sunan bir Amazon Redshift özelliğidir. Bu özellik sayesinde Amazon Redshift, gerektiğinde yoğun talebi karşılamak üzere otomatik olarak geçici kapasite ekler. Amazon Redshift otomatik olarak sorguları ölçeklendirme kümelerine yönlendirir. Bu kümeler saniyeler içinde sağlanır ve anında sorguları işlemeye başlar.

Bu özellik çoğu müşteriye ücretsiz olarak sunulur. Tüm Amazon Redshift kümeleri, günde bir saate kadar ücretsiz Eş Zamanlı Ölçeklendirme kredisi kazanır. Bu sayede, analiz talebinin dalgalandığı dönemlerde bile aylık masraflarınızı öngörebilirsiniz.

S: Esnek Yeniden Boyutlandırma nedir ve Eş Zamanlı Ölçeklendirme ile arasında ne fark vardır?

Esnek Yeniden Boyutlandırma, tek bir Redshift kümesindeki düğümleri dakikalar içinde ekleyerek veya kaldırarak sorgu performansını yönetir. Örneğin, günün belirli saatlerine veya ay sonu raporlamasına yönelik bir ETL iş yükünün zamanında tamamlanabilmesi için ek Redshift kaynakları gerekebilir. Eş Zamanlı Ölçeklendirme, daha fazla küme kaynağı ekleyerek genel sorgu eş zamanlılığını artırır.

S: Eş Zamanlı Ölçeklendirme kümelerine doğrudan erişebilir miyim?

Hayır. Eş Zamanlı Ölçeklendirme, Redshift kaynaklarından oluşan ve çok büyük oranda ölçeklendirilebilen bir havuzdur ve müşteriler buna doğrudan erişemez.

Sorgulama ve analiz

S: Amazon Redshift ve Redshift Spectrum, tercih ettiğim iş zekası yazılım paketi ve ETL araçlarıyla uyumlu mudur?

Evet, sektör standardı SQL kullanmakta olan Amazon Redshift'e, standart JDBC ve ODBC sürücüleri kullanılarak erişilir. Amazon Redshift özel JDBC ve ODBC sürücülerini Redshift Console'un Connect Client (İstemci Bağlama) sekmesinden indirebilirsiniz. Popüler BI ve ETL satıcılarıyla olan entegrasyonumuzu doğruladık ve bunların bazıları, verilerinizi yükleyip analiz etmeye başlamanıza yardımcı olmak için ücretsiz denemeler sunuyor. Dilerseniz AWS Marketplace’e giderek Amazon Redshift ile çalışacak şekilde tasarlanmış çözümleri dakikalar içinde dağıtıp yapılandırabilirsiniz.

Redshift Spectrum, tüm Amazon Redshift istemci araçlarını destekler. İstemci araçları ODBC ve JDBC bağlantıları kullanarak Amazon Redshift kümesinin uç noktasına bağlanmaya devam edebilir. Değişiklik gerekmez.

Tam olarak aynı söz dizimini kullanırsınız ve Redshift Spectrum’daki tablolara erişim için Redshift kümenizin yerel depolama alanındaki tablolarla aynı sorgulama özelliklerine sahip olursunuz. Harici tablolara, bunlar kaydedilirken kullanılan CREATE EXTERNAL SCHEMA komutunda tanımlanan şema adı kullanılarak başvurulur.

S: Redshift Spectrum hangi veri ve sıkıştırma biçimlerini destekler?

Redshift Spectrum şu anda Avro, CSV, Grok, Amazon Ion, JSON, ORC, Parquet, RCFile, RegexSerDe, Sequence, Text ve TSV dahil olmak üzere birçok açık kaynak veri biçimini destekler.

Redshift Spectrum şu an Gzip ve Snappy sıkıştırmayı destekler.

S: Yerel depolama alanımdaki bir tablo, harici bir tabloyla aynı ada sahipse ne olur?

Yerel tablolarda olduğu gibi, sorgunuzda şema adını şema_adı.tablo_adı biçiminde kullanarak tam olarak hangisini kast ettiğinizi seçebilirsiniz.

S: S3 data lake’imle ilgili meta verileri depolamak için bir Hive Metastore kullanıyorum. Redshift Spectrum’u kullanabilir miyim?

Evet. CREATE EXTERNAL SCHEMA komutu Hive Metastore’ları destekler. Şu anda Hive Metastore’a yönelik DDL desteği sunmuyoruz.

S: Kümemde oluşturulan tüm harici veritabanı tablolarının listesine nasıl ulaşabilirim?

Bu bilgiyi edinmek için SVV_EXTERNAL_TABLES adlı sistem tablosunu sorgulayabilirsiniz.

S: Redshift, SQL ile birlikte Makine Öğrenimi kullanma özelliğini destekler mi?

Evet, Amazon Redshift ML (önizleme) özelliği SQL kullanıcılarının aşina oldukları SQL komutlarını kullanarak makine öğrenimi (ML) modellerini oluşturmasını, eğitmesini ve dağıtmasını kolaylaştırır. Amazon Redshift ML, müşterilere tam olarak yönetilen bir makine öğrenimi hizmeti olan Amazon SageMaker kullanarak Amazon Redshift'teki verilerinden yararlanma imkanı tanır.

S: Amazon Redshift, verileri sorgulamak için bir API sağlıyor mu?

Amazon Redshift, her türlü geleneksel, bulut temelli ve container'lı, sunucusuz web hizmetleri tabanlı ve olay odaklı uygulamalarla Amazon Redshift'teki verilerinize sorunsuz şekilde erişmenize olanak tanıyan bir Veri API'si sunmaktadır. Sürücüleri yapılandırmanız ve veritabanı bağlantılarını yönetmeniz gerekmediği için Veri API'si, Amazon Redshift erişimini basitleştirir. Bunun yerine, Veri API'si tarafından sağlanan güvenli bir API uç noktasını çağırarak bir Amazon Redshift kümesinde SQL sorguları çalıştırabilirsiniz. Veritabanı bağlantılarını yönetme ve verileri arabelleğe alma işini Veri API'si üstlenir. Veri API'si zaman uyumsuz olduğundan, sonuçlarınızı daha sonra alabilirsiniz. Sorgu sonuçlarınız 24 saat boyunca depolanır.

S: Amazon Redshift Veri API'siyle birlikte hangi tür kimlik bilgilerini kullanabilirim?

Veri API'si hem IAM kimlik bilgilerini hem de AWS Secrets Manager'dan gizli anahtar kullanımını desteklemektedir. Veri API'sinin AWS Identity and Access Management (IAM) kimlik bilgilerini federe etmesi sayesinde API çağrılarında veritabanı kimlik bilgilerini aktarmadan Okta veya Azure Active Directory gibi kimlik bilgileri sağlayıcılarını ya da Secrets Manager'da depolanan veritabanı kimlik bilgilerini kullanabilirsiniz.

S: Amazon Redshift Veri API'sini AWS CLI'dan kullanabilir miyim?

Evet, aws redshift-data komut satırı seçeneğiyle Veri API'sini AWS CLI'dan kullanabilirsiniz.

S: Redshift Veri API'si diğer AWS hizmetlerine entegre midir?

Veri API'sini AWS Lambda, AWS Cloud9, AWS AppSync ve Amazon EventBridge gibi diğer hizmetlerden kullanabilirsiniz.

S: Amazon Redshift Veri API'sini kullanmak için ayrı bir ödeme yapmam gerekir mi?

Hayır, Veri API'sini kullanmaya ilişkin ayrı bir ücret söz konusu değildir.

İzleme

S: Amazon Redshift veri ambarı kümemin performansını nasıl izleyebilirim?

Amazon Redshift veri ambarı kümenize yönelik işlem kullanımı, depolama kullanımı ve okuma/yazma trafiğine ilişkin ölçümlere AWS Management Console veya Amazon CloudWatch API'leri aracılığıyla ücretsiz olarak erişebilirsiniz. Amazon CloudWatch'un özel ölçüm işlevi aracılığıyla, kullanıcı tarafından tanımlanmış başka ölçümler ekleyebilirsiniz. AWS Management Console, tüm kümelerinizin durumunu ve performansını izlemenize yardımcı olacak bir izleme panosu sağlar. Amazon Redshift ayrıca AWS Management Console aracılığıyla sorgu ve küme performansıyla ilgili bilgi sağlar. Bu bilgiler, sorgu planlarını ve yürütme istatistiklerini görüntüleyerek en çok sistem kaynağını hangi kullanıcıların ve sorguların tükettiğini görmenize ve performans sorunlarını tanılamanıza olanak tanır. Ayrıca, verilerinizin ve sorgularınızın tüm düğümlere dengeli bir şekilde dağıldığından emin olmak için işlem düğümlerinizin her birindeki kaynak kullanımını görebilirsiniz.

Bakım

S: Bakım aralığı nedir? S: Yazılım bakımı sırasında veri ambarı kümeme erişilebilir mi?

Amazon Redshift, düzenli aralıklarla bakım gerçekleştirerek düzeltmeleri, geliştirmeleri ve yeni özellikleri kümenize uygular. Kümeyi programlama yoluyla ya da Redshift Console’u ile değiştirerek zamanlanan bakım aralıklarını değişltirebilirsiniz. Bu bakım aralıkları sırasında Amazon Redshift kümeniz normal işlemlere kapalı olur. Bakım aralıkları ve bölgeye göre zamanlamalar hakkında daha fazla bilgi edinmek için Amazon Redshift Yönetim Kılavuzu’nun Bakım Aralıkları bölümüne bakın.

Amazon Redshift fiyatlandırması hakkında daha fazla bilgi edinin

Fiyatlandırma sayfasını ziyaret edin
Oluşturmaya hazır mısınız?
Amazon Redshift'i kullanmaya başlayın
Başka sorunuz mu var?
Bize ulaşın