Genel

Yenilikler sayfasından Amazon Redshift’teki yenilikleri öğrenebilirsiniz.
Daha detaylı bilgiler ve kullanım kılavuzu için Belgeler sayfasını ziyaret edin.

S: Amazon Redshift nedir?

Amazon Redshift, hızlı ve tam olarak yönetilen bir bulut veri ambarıdır. Standart SQL ve mevcut Business Intelligence (BI) araçlarınızı kullanarak tüm verilerinizi analiz etmenizi basitleştirir ve uygun maliyetli hale getirir. İleri düzey sorgu optimizasyonu, yüksek performanslı depolarda sütunlu depolama ve yüksek hacimli paralel sorgu yürütmeyi kullanarak terabayt ve petabaytlarca yapılandırılmış veri üzerinde sofistike analiz sorguları yürütmenize olanak sağlar. Sonuçların çoğu saniyeler içinde döner. Redshift ile hiçbir taahhüt olmaksızın saatte yalnızca 0,25 USD karşılığında küçük ölçekte başlayabilir ve yıllık terabayt başına 1.000 USD ödeyerek geleneksel yerinde çözümlerin onda birinden daha düşük bir fiyata ölçeği petabaytlarca veriye genişletebilirsiniz. Amazon Redshift, Amazon S3 data lake’lerinde bulunan eksabaytlarca yapılandırılmamış veri üzerinde doğrudan SQL sorguları yürütmenizi sağlayan Amazon Redshift Spectrum'u da içerir. Yükleme ya da dönüşüm gerektirmediği gibi Avro, CSV, Grok, Amazon Ion, JSON, ORC, Parquet, RCFile, RegexSerDe, Sequence, Text ve TSV gibi açık veri biçimlerini kullanabilirsiniz. Redshift Spectrum, sorgu işlem kapasitesini alınan verilere göre otomatik olarak ölçeklendirdiğinden, Amazon S3’e yönelik sorgular veri kümesi boyutundan bağımsız olarak hızlı çalışır.

Amazon Redshift, yapılandırılmış veriler üzerinde tanıdık SQL tabanlı istemcileri ve iş zekası (BI) araçları ile standart ODBC ve JDBC bağlantılarını kullanarak hızlı sorgulama özelliklerine sahip olmanızı sağlar. Sorgular birden çok fiziksel kaynağa dağıtılır ve bunlar arasında paralel hale getirilir. Amazon Redshift veri ambarının ölçeğini AWS Management Console’da birkaç tıklamayla ya da tek bir API çağrısı ile büyütüp küçültebilirsiniz. Amazon Redshift, veri ambarınıza otomatik olarak düzeltme eki uygular, ambarı yedekler ve elde edilen yedekleri kullanıcı tarafından tanımlanan bir tutma dönemi boyunca depolar. Amazon Redshift, erişilebilirliği iyileştirmek ve veri dayanıklılığını geliştirmek için çoğaltma ve sürekli yedekleme kullanmasının yanı sıra bileşen ve düğüm hatalarından otomatik olarak kurtarılabilir. Ayrıca, Amazon Redshift, aktarılan ve beklemedeki verileri korumak için AWS IAM entegrasyonu, kimlik federasyonu, sütun düzeyinde erişim kontrolü, Amazon Virtual Private Cloud (Amazon VPC), SSL, AES-256 şifreleme ve entegre AWS KMS entegrasyonu ile sektör lideri güvenliği destekler. Tüm Amazon Redshift güvenlik özellikleri hiçbir ek ücret olmadan dahildir.

Amazon Redshift, tüm Redshift API çağrılarını denetlemenizi sağlamak için AWS CloudTrail ile entegre olur. Redshift bağlantı denemeleri, sorgular ve veri ambarınızda yapılan değişiklikler gibi tüm SQL işlemlerini günlük dosyasına kaydeder. Bu kayıtlara sistem tablolarında SQL sorguları çalıştırarak erişebilir veya günlükleri Amazon S3'teki güvenli bir konuma kaydetmeyi tercih edebilirsiniz. Amazon Redshift SOC1, SOC2, SOC3 ve PCI DSS Level 1 gereksinimlerine uygundur.

Tüm Amazon Web Services hizmetlerinde olduğu gibi peşin yatırım gerekmez ve yalnızca kullandığınız kaynaklar için ücret ödersiniz. Amazon Redshift, kullandıkça ödemenize olanak tanır. Amazon Redshift’i ücretsiz olarak deneme olanağınız bile vardır.

Bölgesel Amazon Redshift erişilebilirliği için bkz. AWS Bölge Tablosu.

S: Şirket içi bir veri ambarı üzerinde neden Amazon Redshift’i kullanayım?

Şirket içi veri ambarları, özellikle de büyük veri kümelerinin yönetilmesi için önemli ölçüde zaman ve kaynak gerektirir. Ayrıca, kendi yönettiğiniz şirket içi veri ambarlarının oluşturulması, bakımının yapılması ve büyütülmesiyle ilişkili finansal maliyet çok yüksektir. Verileriniz büyüdükçe maliyetleri yönetebilmek, ETL karmaşıklığını düşük tutmak ve iyi performans sağlamak amacıyla hangi verileri veri ambarınıza, hangilerini arşive yükleyeceğiniz konusunda sürekli bir denge bulmak zorunda kalırsınız. Amazon Redshift bir veri ambarının maliyetini ve operasyonel iş yükünü önemli ölçüde azaltmakla kalmaz. Redshift Spectrum ile çok miktarda veri, verilerin yüklenmesi gerekmeden, kendi yerel biçiminde kolayca analiz edilebilir.

S: Amazon Redshift için AQUA (Geliştirilmiş Sorgu Hızlandırıcı) nedir?

AQUA, Redshift'in diğer bulut veri ambarlarına kıyasla 10 kata kadar daha hızlı çalışmasını sağlayan dağıtılmış ve donanımsal olarak hızlandırılmış yeni bir önbellektir. Merkezi depolamaya sahip mevcut veri ambarı mimarileri, verilerin işlenmek üzere kümeleri hesaplamak için taşınmasını gerektirir. Veri ambarları önümüzdeki birkaç yıl içinde büyümeye devam ettikçe, tüm bu verileri taşımak için gereken ağ bant genişliği sorgu performansı üzerinde zorluk oluşturur.

AQUA, bulut veri ambarına yeni bir yaklaşım getirmektedir. AQUA, inovatif önbellekte yerinde veri işlemenin önemli bir bölümünü yaparak hesaplama işlemini depolamaya getirir. Ayrıca, geleneksel CPU’ların bugün yapabileceklerinin ötesinde veri işlemeyi hızlandırmak için AWS tasarımlı işlemciler ve bir ölçeklendirme mimarisi kullanır. Daha fazla bilgi edinin ve önizleme için değerlendirilmek üzere kaydolun.

S: Redshift Spectrum nedir?

Redshift Spectrum, Amazon S3’te bulunan eksabaytlarca yapılandırılmamış veri üzerinde, yükleme veya ETL gerekmeksizin sorgu çalıştırabilmenize olanak sağlayan bir Amazon Redshift özelliğidir. Bir sorgu gönderdiğinizde, bir sorgu planı oluşturup bunu optimize eden Amazon Redshift SQL uç noktasına gider. Amazon Redshift yerel ortamda ve Amazon S3'te bulunan verileri belirler, okunması gereken Amazon S3 verilerini en düşük miktara indirmek üzere bir plan oluşturur ve Redshift Spectrum çalışanlarının paylaşılan bir kaynak havuzu üzerinden Amazon S3'teki verileri okuyup işlemelerini talep eder.

Redshift Spectrum ölçeği gerekli durumlarda binlerce bulut sunucusu içerecek şekilde genişletilebildiğinden, veri boyutu ne olursa olsun sorgular hızlıca çalıştırılabilir. Ayrıca, halihazırda Amazon Redshift sorguları için yaptığınız şekilde, Amazon S3 verileriniz için de tam olarak aynı SQL’i kullanabilir ve aynı BI araçlarınızı kullanarak aynı Amazon Redshift uç noktasına bağlanabilirsiniz. Redshift Spectrum, depolama ve işlem süreçlerini ayırarak her ikisini de birbirinden bağımsız bir şekilde ölçeklendirmenize olanak sağlar. Amazon S3 Data Lake'inizi sorgulamak için ihtiyaç duyduğunuz sayıda, yüksek erişilebilirlik ve sınırsız eş zamanlılık sunan Amazon Redshift kümelerinden kurabilirsiniz. Redshift Spectrum, verilerinizi dilediğiniz yerde ve biçimde, ihtiyaç duyduğunuz anda işlemeye hazır bir şekilde depolama özgürlüğü sunar. Bölgesel Redshift Spectrum erişilebilirliği hakkında bilgi edinmek için lütfen Amazon Redshift fiyatlandırma sayfasını ziyaret edin.

S: Amazon Redshift yönetilen depolama nedir?

Amazon Redshift tarafından yönetilen depolama, RA3 düğüm tipleriyle kullanılabilir ve kümeyi yalnızca hesaplama gereksinimlerinize göre boyutlandırmak üzere bilgisayar ve depolama alanı için bağımsız olarak ölçeklendirmenize ve ödeme yapmanıza olanak tanır. Amazon Redshift, katman-1 önbellek olarak otomatik olarak yüksek performanslı SSD tabanlı yerel depolamayı kullanır ve herhangi bir işlem yapmadan otomatik olarak Amazon S3’e ölçeklendirirken yüksek performans sağlamak için veri bloğu sıcaklığı, veri bloğu yaşı ve iş yükü şablonları gibi optimizasyonlardan yararlanır.

Q: Amazon Redshift’in yönetilen depolamasını nasıl kullanırım?

Zaten Amazon Redshift DS veya DC düğümlerini kullanıyorsanız, yönetilen depolamayı kullanmak için mevcut kümelerinizi yeni işlem bulut sunucusu RA3’e yükseltebilirsiniz. Ayrıca, RA3 bulut sunucusu temelli yeni bir küme oluşturabilirsiniz ve yönetilen depolama otomatik olarak dahil edilir. Bu özelliği kullanmak için başka bir işlem gerekmez.

S: Amazon Redshift veri ambarı yönetimini nasıl basitleştirir?

Amazon Redshift; bir veri ambarı kurmak, işletmek ve ölçeklendirmek için gereken işleri yönetir. Örneğin; altyapı kapasitesinin sağlanması, yedekleme ve yamalama gibi devam eden yönetim görevlerinin otomatikleştirilmesi ve hataları gidermek için düğümlerin ve sürücülerin izlenmesi. Amazon Redshift, Redshift Spectrum için işlem altyapısı, yük dengeleme ve planlamanın yanı sıra Amazon S3’te depolanan verilere yönelik sorgularınızı zamanlama ve yürütme süreçlerinin tümünü yönetir.

S: Veri ambarı ve analiz için sunulan çoğu yerinde veritabanına kıyasla Amazon Redshift’in performansı nasıldır?

Amazon Redshift, çeşitli inovasyonlardan yararlanarak veri ambarı ve analiz iş yükleri için geleneksel veritabanlarından on kata kadar daha yüksek bir performans düzeyine ulaşır ve şunları içerir:

  • Sütunlu Veri Depolama: Amazon Redshift, verileri bir dizi satır şeklinde depolamaktansa sütunlar halinde düzenler. Sütun tabanlı sistemler, işlemlerin işlenmesi için ideal olan satır tabanlı sistemlerden farklı olarak, sorguların genellikle büyük veri kümeleri üzerinde gerçekleştirilen toplama işlemleri gerektirdiği veri ambarı ve analiz iş yükleri için idealdir. Yalnızca sorgularla ilgili sütunlar işlendiğinden ve sütunlu veriler depolama medyasında sıralı olarak depolandığından, sütun tabanlı sistemler çok daha az G/Ç gerektirerek sorgu performansını önemli ölçüde artırır.
  • Gelişmiş Sıkıştırma: Diskte benzer veriler sıralı olarak depolandığından, sütunlu veri depoları satır tabanlı veri depolarından çok daha fazla sıkıştırılabilir. Amazon Redshift birden çok sıkıştırma tekniği kullanır ve çoğu zaman geleneksel ilişkisel veri depolarına kıyasla önemli bir sıkıştırma oranına ulaşabilir. Boş bir tabloya veri yüklenirken Amazon Redshift otomatik olarak verilerinizden örnek toplar ve en uygun sıkıştırma şemasını seçer.
  • Yüksek Hacimli Paralel İşleme (MPP): Amazon Redshift, veri ve sorgu yükünü otomatik olarak tüm düğümlere dağıtır. Amazon Redshift, veri ambarınıza düğüm eklemeyi kolaylaştırır ve veri ambarınız büyürken hızlı sorgu performansını korumanıza olanak tanır.
  • Redshift Spectrum: Redshift Spectrum, Amazon S3’teki eksabaytlarca veri üzerinde sorgu çalıştırmanızı sağlar. Yükleme veya ETL gerekmez. Verilerinizin hiçbirini Amazon Redshift’te depolamasanız bile Redshift Spectrum’u kullanarak Amazon S3’te depolanan 1 eksabayta kadar boyutlu veri kümelerini sorgulayabilirsiniz. Bir sorgu gönderdiğinizde, bir sorgu planı oluşturan Amazon Redshift SQL uç noktasına gider. Amazon Redshift yerel ortamda ve Amazon S3'te bulunan verileri belirler, okunması gereken Amazon S3 verilerini en düşük miktara indirmek üzere bir plan oluşturur, Redshift Spectrum çalışanlarının paylaşılan bir kaynak havuzu üzerinden Amazon S3'teki verileri okuyup işlemesini talep eder ve geriye kalan işlemler için sonuçları Amazon Redshift kümenize geri alır.
  • Gerçekleştirilmiş görünümler: Gerçekleştirilmiş görünümler; pano oluşturma, iş zekası (BI) araçları ve ELT’den (Extract, Load, Transform) gelen sorgular ve Ayıklama, Yükleme, Dönüştürme veri işleme işleri gibi analitik iş yükleri için çok daha hızlı sorgu performansı elde etmenize imkan verir. Gerçekleştirilmiş görünümleri kullanarak, önceden işlenmiş sorgu sonuçlarını saklayabilir ve kaynak tablolarında yapılan en son değişiklikleri aşamalı olarak işleyerek bunları verimli bir şekilde koruyabilirsiniz. Gerçekleştirilen görünümleri referans alan sonraki sorgular daha hızlı çalışmak için önceden işlenmiş sonuçları kullanır. Gerçekleştirilmiş görünümler; filtreler, projeksiyonlar, iç birleşimler, toplamalar, gruplama, işlevler ve diğer SQL yapılarını kullanılarak bir veya daha fazla kaynak tablo temelli olarak oluşturulabilir.
  • Ölçeklenebilirlik: Yerinde veri ambarlarının işlem ve depolama kapasitesi, yerinde donanımın kısıtlamaları ile sınırlıdır. Redshift, değişen iş yükü gereksinimlerini karşılamak için bilgisayar ve depolamayı gerektiği gibi ölçeklendirebilmenizi sağlar.

S: Amazon Redshift’i kullanmaya nasıl başlarım?

Amazon Redshift ayrıntı sayfasından veya AWS Management Console üzerinden kaydolarak dakikalar içinde kullanmaya başlayabilirsiniz. AWS hesabınız yoksa bir hesap oluşturmanız istenir. Amazon Redshift’i nasıl ücretsiz deneyebileceğinizi öğrenmek için Kullanmaya Başla sayfasını ziyaret edin.

S: Bir Amazon Redshift veri ambarı kümesi oluşturup buna nasıl erişebilirim?

AWS Management Console’u ya da Amazon Redshift API’lerini kullanarak kolayca bir Amazon Redshift veri ambarı kümesi oluşturabilirsiniz. Tek düğümlü, 160 GB boyutlu bir veri ambarıyla kullanmaya başlayabilir ve AWS Console’da birkaç tıklamayla ya da tek bir API çağrısıyla ölçeği petabayt ölçeğine veya onun da üzerine çıkarabilirsiniz.

Değerlendirme veya gelişim/test iş yükleri için en iyi uygunluğa sahip tek düğümlü yapılandırma, Amazon Redshift’i hızla ve uygun maliyetli bir şekilde kullanmaya başlayıp gereksinimleriniz büyüdükçe ölçeği çok düğümlü bir yapılandırmaya büyütmenize olanak tanır. Bir Redshift veri ambarı kümesi, düğüm türüne bağlı olarak 1 ila 128 işlem düğümü içerebilir. Ayrıntılar için lütfen belgelerimize bakın.

Çok düğümlü yapılandırma, istemci bağlantılarını yöneten ve sorguları alan bir baş düğümün yanı sıra verileri depolayıp sorguları ve hesaplamaları gerçekleştiren iki işlem düğümü gerektirir. İşlem düğümü ile aynı boyuta sahip baş düğüm sizin adınıza otomatik olarak tedarik edilir ve bunun için ücret ödemezsiniz.

Tek yapmanız gereken, tercih ettiğiniz Erişilebilirlik Alanı’nı (isteğe bağlı), düğüm sayısını, düğüm türlerini, bir ana adı ve parolayı, güvenlik gruplarını, yedek tutma tercihlerinizi ve diğer sistem ayarlarını belirtmektir. İstediğiniz yapılandırmayı seçtiğinizde, Amazon Redshift gerekli kaynakları tedarik eder ve veri ambarı kümenizin kurulumunu yapar.

Veri ambarı kümeniz erişilebilir hale geldiğinde AWS Management Console’dan ya da Redshift API’lerini kullanarak kümenin uç noktasını ve JDBC ve ODBC bağlantı dizesini alabilirsiniz. Daha sonra bu bağlantı dizesini en sevdiğiniz veritabanı aracı, programlama dili veya İş Zekası (BI) aracıyla kullanabilirsiniz. Çalışmakta olan veri ambarı kümenize yönelik ağ isteklerini yetkilendirmeniz gerekir. Ayrıntılı bir açıklama için lütfen Kullanmaya Başlama Kılavuzumuza başvurun.

S: İşlem düğümü başına maksimum depolama kapasitesi ne kadardır? En uygun performans için işlem düğümü başına önerilen veri miktarı nedir?

RA3, DC veya DS düğüm türlerimizden birini kullanarak bir küme oluşturabilirsiniz. RA3 düğüm türleri işlem ve depolamayı bağımsız olarak ölçeklendirmenize ve bunlar için ödeme yapmanıza olanak sağlar. Performans gereksinimlerinize göre ihtiyacınız olan bulut sunucusu sayısını seçer ve yalnızca kullandığınız yönetilen depolama için ödeme yaparsınız.

RA3 düğüm türleri, RA3.16XL ve RA3.4XL olmak üzere iki boyutta sunulmaktadır. Her RA3.16XL düğümü, 48 vCPU, 384 GiB bellek içerir ve 8 GB/s IO'yu destekler. Hem RA3.16XL hem de RA3.4XL kümeleri minimum iki düğümle çalışır ve minimum boyutlu iki düğümlü RA3.16XL veya RA3.4XL kümesi 128 TB yönetilen depolama sunar. Her düğüm için hem RA3.16XL hem de RA3.4XL için yönetilen depolama kotası 64 TB'dir. RA3.16XL kümeleri yönetilen depolamada 8 petabayta kadar küme oluşturmaya olanak sağlayan 128 düğüme kadar ölçekleme yapabilir. Bir RA3.4XL düğümünde 12 vCPU, 96 GiB bellek vardır ve 2 GB/s I/O’yu destekler. RA3.4XL kümeleri, 4 petabayta kadar yönetilen depolama ile küme oluşturmaya olanak sağlayan 64 düğüme kadar ölçekleme yapabilir. Not: Burada belirtilen tüm yönetilen depolama boyutları, sıkıştırılmış veriler içindir. Redshift, verileri 3-4 kata kadar sıkıştırır ve böylece sıkıştırılmamış veri boyutları burada belirtilenden 3-4 kat daha büyük olur.

DC düğüm tipleri artık iki boyutta sunulmaktadır. Büyük seçeneği 160 GB SSD depolama, 2 Intel Xeon E5-2670v2 (Ivy Bridge) sanal çekirdek ve 15 GiB RAM içerir. Bunun 16 katı olan Sekiz Kat Ekstra Büyük, 2,56 TB SSD depolama, 32 Intel Xeon E5-2670v2 sanal çekirdek ve 244 GiB RAM içerir. Saatlik 0,25 USD karşılığında tek bir DC2 Büyük ile çalışmaya başlayabilir ve ölçeği tam 326 TB SSD depolama, 3.200 sanal çekirdek ve 24 TiB RAM içeren 128 8XL’ye kadar genişletebilirsiniz.

Yoğun Depolama (DS) düğüm türleri, Ekstra Büyük ve Sekiz Kat Ekstra Büyük şeklindeki iki boyutta sunulur. Ekstra Büyük (XL) seçeneğinde toplam iki TB manyetik depolama alanına sahip 24 HDD yer alırken, Sekiz Kat Ekstra Büyük (8XL) seçeneğinde toplam 16 TB manyetik depolama alanına sahip 24 HDD vardır. DS2.8XLarge seçeneğinde 36 Intel Xeon E5-2676 v3 (Haswell) sanal çekirdek ve 244 GiB RAM, DS2.XL seçeneğinde ise Intel Xeon E5-2676 v3 (Haswell) sanal çekirdek ve 31 GiB RAM vardır.

Daha fazla ayrıntı için lütfen fiyatlandırma sayfamıza bakın.

S: Hangi durumlarda Amazon RDS yerine Amazon Redshift kullanmalıyım?

Hem Amazon Redshift hem de Amazon RDS, veritabanı yönetim yükünü devrederek geleneksel ilişkisel veritabanları çalıştırmanıza olanak tanır. Müşteriler Amazon RDS veritabanlarını en çok çevrimiçi işlem gerçekleştirme (OLTP) iş yükü için, Redshift’i ise en çok raporlama ve analiz için kullanıyorlar. OLTP iş yükleri; ekleme, güncelleme ve silme gibi işlemler için belirli bilgilerin ve desteğin hızlı bir şekilde sorgulanmasını gerektirir ve en iyi şekilde Amazon RDS tarafından işlenir. Amazon Redshift, birden çok düğümün ölçeğinden ve kaynaklarından yararlanmasının yanı sıra çeşitli optimizasyonlar kullanarak çok büyük veri kümeleri üzerinde analiz ve raporlama iş yükleri için geleneksel veritabanlarına kıyasla performansı bir üst düzeye taşır. Amazon Redshift, verilerinizin boyutu ve sorgularınızın karmaşıklığı arttıkça ya da raporlama ve analiz işlemlerinizin OLTP iş yükünüzün performansını etkilemesini engellemek amacıyla ölçek genişletmek için harika bir seçenek sunar. Artık yeni Birleşik Sorgu özelliği sayesinde, Amazon RDS’iniz veya Aurora veritabanı hizmetlerinizde Redshift’le kolayca veri sorgulaması yapabilirsiniz.

S: Hangi durumlarda Amazon EMR yerine Amazon Redshift veya Redshift Spectrum kullanmalıyım?

Apache Spark, Hadoop, Presto veya Hbase gibi büyük veri işleme framework’leriyle son derece büyük veri kümelerini işlemek ve analiz etmek için özel kod kullanıyorsanız Amazon EMR’yi kullanmalısınız. Amazon EMR, kümelerinizin yapılandırılması ve kümelerinize yüklediğiniz yazılımlar konusunda tam denetime sahip olmanızı sağlar.

Amazon Redshift gibi veri ambarları, tamamen farklı türde bir analiz için tasarlanmıştır. Veri ambarlarının tasarım amacı, envanter, finans ve perakende satış sistemleri gibi birçok farklı kaynaktan alınan verilerin bir araya toplanmasıdır. Şirket genelinde raporlamanın tutarlı bir şekilde doğru olmasının sağlanması için veri ambarları, verileri yüksek oranda yapılandırılmış bir şekilde depolar. Bu yapı, doğrudan veritabanı tablolarında yerleşik olarak veri tutarlılığı kuralları uygulanmasını sağlar. Amazon Redshift, devasa büyüklükteki yapılandırılmış ve yarı yapılandırılmış veri koleksiyonları üzerinde karmaşık sorgular gerçekleştirmenizi ve son derece hızlı performansa sahip olmanızı gerektiren durumlarda kullanılacak en iyi hizmettir.

Amazon Redshift ve S3’teki veriler üzerinde sorgu çalıştırmak için Redshift Spectrum özelliği harika bir seçenek olsa da genellikle kurumların Amazon EMR gibi işleme framework’lerinden beklediği kullanım örnekleri için pek uygun değildir. Amazon EMR, SQL sorguları çalıştırmanın çok daha ötesine gider. Amazon EMR, tam olarak özelleştirilebilir kümelerde Spark, Hadoop ve Presto gibi popüler büyük veri işleme framework’lerinin en son sürümlerini kullanarak son derece büyük veri kümelerini işlemenize ve analiz etmenize olanak tanıyan, yönetilen bir hizmettir. Amazon EMR ile makine öğrenimi, grafik analizi, veri dönüşümü, veri akışı gibi uygulamalar ve kodunu yazabileceğiniz neredeyse her şey için birçok farklı çeşit ölçeği genişletilebilir veri işleme görevi çalıştırabilirsiniz.

Redshift Spectrum’u EMR ile birlikte kullanabilirsiniz. Redshift Spectrum, tablo tanımlarını depolamak için Amazon EMR ile aynı yaklaşımı kullanır. Redshift Spectrum, verileri ve tablo tanımlarını bulmak için Amazon EMR tarafından kullanılan Apache Hive Metastore’u destekleyebilir. Amazon EMR hizmetini kullanıyorsanız ve zaten bir Hive Metastore’unuz varsa tek yapmanız gereken, Amazon Redshift kümenizi bunu kullanacak şekilde yapılandırmaktır. Daha sonra Amazon EMR i̇şlerinizin yanı sıra bu verileri doğrudan sorgulamaya başlayabilirsiniz. Bundan dolayı, büyük bir veri deposunu kullanmak için zaten EMR hizmetini kullanıyorsanız Redshift Spectrum’u tam olarak bununla aynı anda, Amazon EMR işlerinize engel olmaksızın kullanarak verileri sorgulayabilirsiniz.

Sorgu hizmetleri, veri ambarları ve karmaşık veri işleme framework’leri birbirinden farklıdır ve farklı amaçlar için kullanılır. İş için doğru aracı seçmeniz yeterli.

S: Hangi durumlarda Redshift Spectrum yerine Amazon Athena’yı kullanmalıyım?

Amazon Athena, dilediğiniz çalışana Amazon S3’teki veriler üzerinde anlık sorgular çalıştırma olanağı sağlamanın en basit yoludur. Athena sunucusuz olduğundan kurmanız veya yönetmeniz gereken bir altyapı yoktur. Athena ile verilerinizi hemen analiz etmeye başlayabilirsiniz.

Tutarlı, yüksek oranda yapılandırılmış bir biçimde depolanması gereken, sık erişilen verileriniz varsa Amazon Redshift gibi bir veri ambarı kullanmalısınız. Amazon Redshift’teki yapılandırılmış, sık erişilen verileri depolama ve Redshift Spectrum’u kullanarak Amazon Redshift sorgularınızı Amazon S3 data lake’inizdeki veri evreninin tamamını kapsayacak şekilde genişletme esnekliğine sahip olursunuz. Böylece, verilerinizi dilediğiniz yerde ve biçimde, ihtiyaç duyduğunuz anda işlemeye hazır bir şekilde depolama özgürlüğünüz olur.

S: Amazon EC2’de kendi MPP veri ambarı kümemi çalıştırmak yerine neden Amazon Redshift’i kullanmalıyım?

Amazon Redshift, aşağıdakiler dahil olmak üzere kendi veri ambarınızı yönetmenin getirdiği, zaman alan birçok görevi otomatik olarak yerine getirir:
  • Kurulum: Amazon Redshift ile verilerinizi yükleyip sorgulamaya başlamak için tek yapmanız gereken bir veri ambarı kümesi oluşturma ve şemanızı tanımlamaktır. Sağlama, yapılandırma veya yamalamayı yönetmeniz gerekmez.
  • Veri Dayanıklılığı: Amazon Redshift, verilerinizi veri ambarı kümenizin içinde çoğaltır ve on bir dokuzluk dayanıklılık sağlayacak şekilde tasarlanmış Amazon S3’e sürekli olarak yedekler. Amazon Redshift, her bir sürücüde yer alan verileri kümenizdeki diğer düğümlere yansıtır. Bir sürücü başarısız olursa sorgularınız, Redshift’in replikalardan sürücünüzü yeniden oluşturması sırasında oluşan küçük bir gecikme süresi artışıyla da olsa devam eder. Düğüm hatası söz konusu olduğunda, Amazon Redshift otomatik olarak yeni düğüm tedarik eder ve kümenin içindeki diğer düğümlerden ya da Amazon S3’ten verileri geri yüklemeye başlar. En sık yürütülen sorgularınızın hızla çalışır hale gelmesi için en sık sorguladığınız verilerin geri yüklenmesine öncelik verir.
  • Ölçeklendirme: Kapasite ve performans gereksinimleriniz değiştikçe Amazon Redshift veri ambarı kümenizde tek bir API çağrısıyla veya AWS Management Console’da birkaç tıklamayla düğüm ekleyip kaldırabilirsiniz. Ayrıca Redshift’teki zamanlayıcı özelliğini kullanarak ölçeklendirme ve yeniden boyutlandırma operasyonlarınızı planlayabilirsiniz.
  • Otomatik Güncelleştirme ve Düzeltme Eki Uygulama: Amazon Redshift, yükseltmeleri ve düzeltme eklerini otomatik bir biçimde veri ambarınıza uygulayarak uygulamanızın yönetimine değil, kendisine odaklanmanızı mümkün kılar.
  • Eksabayt Ölçeğinde Sorgu Olanağı: Redshift Spectrum, Amazon S3’teki eksabaytlarca veri üzerinde sorgu çalıştırmanızı sağlar. Yükleme veya ETL gerekmez. Verilerinizin hiçbirini Amazon Redshift’te depolamasanız bile Redshift Spectrum’u kullanarak Amazon S3’te depolanan 1 eksabayta kadar boyutlu veri kümelerini sorgulayabilirsiniz.

Faturalandırma

S: Amazon Redshift kullanımım için hangi ücretleri öderim ve nasıl faturalandırılırım?

Yalnızca kullandığınız kadar ödersiniz ve minimum ücret veya kurulum ücreti yoktur. Amazon Redshift, bir kümeyi duraklatma ve devam ettirme özelliğini destekleyerek müşterilerin küme kullanılmadığında isteğe bağlı faturalandırmayı kolayca askıya almasını sağlıyor. Örneğin; geliştirme için kullanılan bir kümede, kullanılmadığında işlem faturalandırması askıya alınabilir. Küme duraklatıldığında yalnızca küme depolaması için ücretlendirilirsiniz. Rezerve Edilmiş Bulut Sunucuları, kararlı durumdaki üretim iş yükleri için istek üzerine fiyatlandırma ile karşılaştırıldığında önemli ölçüde indirim sağlar.

Bir veri ambarı kümesi, küme erişilebilir olduğu andan itibaren faturalandırılmaya başlanır. Faturalandırma, veri ambarı kümesi sonlandırılana (bulut sunucusu silindiğinde veya başarısız olduğunda gerçekleşebilir) kadar devam eder. Şunlar temel alınarak faturalandırılırsınız:

  • İşlem düğümü saati: İşlem düğümü saatleri, faturalandırma dönemi boyunca tüm işlem düğümlerinizi çalıştırdığınız toplam saat sayısıdır. Veri ambarı kümenizin erişilebilir durumda çalıştığı her saat için faturaya düğüm kullanım saatleri yansıtılır. Veri ambarı kümenizin ücretlendirilmeye devam etmesini istemiyorsanız ek düğüm saatleri karşılığında faturalandırılmamak için kümeyi durdurmanız veya sonlandırmanız gerekir. Tüketilen kısmi düğüm saatleri tam saat olarak faturalandırılır. Faturanıza düğüm başına saatlik 1 birim yansıtıldığından, bir ayın tamamı boyunca aralıksız olarak çalışan 3 düğümlü bir veri ambarı kümesi için 2.160 bulut sunucusu saati faturalandırılır. Baş düğüm saatleri için ücret ödemezsiniz; yalnızca işlem düğümleri ücretlidir.
  • Yönetilen depolama: Yönetilen depolama alanında depolanan veriler için, bölgenize yönelik sabit bir aylık GB ücreti ödersiniz. Yönetilen depolama, RA3 düğüm türleriyle birlikte özel olarak sunulur ve veri boyutundan bağımsız olarak Redshift yönetilen depolama için aynı düşük ücreti ödersiniz. Yönetilen depolama kullanımı, yönetilen depoda bulunan toplam verilere göre saatlik olarak hesaplanır. RA3 kümenizdeki veri miktarını Amazon CloudWatch veya AWS Management Console üzerinden izleyebilirsiniz. RA3 düğümleri ve yönetilen depolama arasındaki veri aktarımları için herhangi bir ücret ödemezsiniz. Yönetilen depolama ücretlerine otomatik ve manuel anlık yedeklerden kaynaklanan yedek depolama ücretleri dahil değildir. Küme sonlandırıldıktan sonra, manuel yedeklerinizin tutulması için ücret ödemeye devam edersiniz.
  • Yedek Depolama: Yedek depolama alanı, veri ambarınızın otomatik ve manuel anlık yedekleriyle ilişkilendirilmiş depolama alanıdır. Yedek tutma dönemini uzattığınızda veya ek anlık yedekler aldığınızda, veri ambarınızın kullandığı yedek depolama alanı artar. Etkin veri ambarı kümesi için tedarik edilen depolama alanınızın %100'ü dolana kadar yedek depolama alanı için ek ücret uygulanmaz. Örneğin; 2 TB yerel bulut sunucusu depolama alanına sahip etkin bir Tek Düğüm XL veri ambarı kümeniz varsa ek ücret almadan aylık 2 TB’a kadar yedek depolama alanı sunarız. Tedarik edilen depolama boyutunun üzerindeki yedek depolama alanı ve kümeniz sonlandırıldıktan sonra depolanan yedekler standart Amazon S3 fiyatları üzerinden faturalanır.
  • Veri aktarımı: Aynı Bölge içinde Amazon Redshift ile Amazon S3 arasında aktarılan veriler için veri aktarımı ücretsizdir. Amazon Redshift’e ve dışarı yapılan diğer tüm veri aktarımları, standart AWS veri aktarımı ücretleri üzerinden faturalanır.
  • Taranan veriler: Redshift Spectrum ile sorgunuzun yürütülmesi için taranan Amazon S3 verilerinin miktarına göre ücret ödersiniz. Sorgu çalıştırmadığınızda Redshift Spectrum için ücret ödemezsiniz. Verilerinizi Parquet veya RC gibi sütunlu bir biçimde depolarsanız, Redshift Spectrum satırların tamamını işlemek yerine yalnızca sorgunun ihtiyaç duyduğu sütunları taradığından maliyetleriniz düşer. Benzer şekilde, verileri Redshift Spectrum tarafından desteklenen biçimlerden birini kullanarak sıkıştırırsanız da maliyetleriniz düşer. Veri depolama için standart Amazon S3 ücretlerini, kullanılan küme içinse Amazon Redshift bulut sunucusu ücretlerini ödersiniz.

Aksi belirtilmediği sürece fiyatlarımıza KDV ve ilgili satış vergileri gibi, yürürlükte olan vergiler ve harçlar dahil değildir. Fatura adresi Japonya'da olan müşteriler için AWS hizmetlerinin kullanımı Japonya Tüketim Vergisine tabidir. Daha fazla bilgi edinin.

Amazon Redshift fiyatlandırma bilgileri için lütfen Amazon Redshift fiyatlandırma sayfasını ziyaret edin.

Veri entegrasyonu ve yükleme

S: Amazon Redshift veri ambarıma nasıl veri yükleyebilirim?

Amazon Redshift’e Amazon S3, Amazon RDSAmazon DynamoDB, Amazon EMR, AWS Glue, AWS Data Pipeline gibi çeşitli veri kaynaklarından veya Amazon EC2’deki ya da şirket içindeki başka herhangi bir SSH özellikli konaktan veri yükleyebilirsiniz. Amazon Redshift, veri ambarı kümenize veri alma hızını en üst düzeye çıkarabilmeniz için verilerinizi paralel olarak her işlem düğümüne yüklemeye çalışır. İstemciler ODBC veya JDBC kullanarak Amazon Redshift’e bağlanabilir ve 'insert' SQL komutları çalıştırarak veri ekleyebilir. S3 veya DynamoDB tarafından yöntemler her işlem düğümüne paralel olarak yüklenirken SQL ekleme bildirimlerinin tek bir baş düğüm aracılığıyla yüklenmesi nedeniyle bunun daha yavaş olduğunu lütfen unutmayın. Verileri Amazon Redshift’e yükleme konusunda daha ayrıntılı bilgi edinmek için lütfen Kullanmaya Başlama Kılavuzumuza bakın.

S: Mevcut Amazon RDS, Amazon EMR, Amazon DynamoDB ve Amazon EC2 veri kaynaklarımdan Amazon Redshift’e nasıl veri yükleyebilirim?

COPY komutumuzu kullanarak Amazon EMR, Amazon DynamoDB veya SSH özellikli herhangi bir konaktan doğrudan Amazon Redshift’e paralel olarak veri yükleyebilirsiniz. Redshift Spectrum, basit bir INSERT INTO komutuyla Amazon S3’ten kümenize veri yüklemenize de olanak tanır. Bu sayede, kümenize Parquet ve RC gibi farklı biçimlerden veri yükleyebilirsiniz. Bu yaklaşımı kullanmanız durumunda Amazon S3’ten taranan veriler için Redshift Spectrum ücretleri uygulanacağını unutmayın. 

Ayrıca, birçok ETL şirketi, sunduğu araçlarla kullanım konusunda Amazon Redshift’e sertifika vermiştir ve bunların bazıları, verilerinizi yüklemeye başlamanıza yardımcı olmak için ücretsiz deneme sunar. AWS Data Pipeline, Amazon RDS ve Redshift gibi çeşitli AWS veri kaynaklarından veri yüklemeye yönelik yüksek performanslı, güvenilir, hata toleranslı bir çözüm sağlar. AWS Data Pipeline’ı kullanarak veri kaynağını, istenen veri dönüşümlerini belirtebilir, sonra da önceden yazılmış bir içeri aktarma betiğini kullanarak verilerinizi Amazon Redshift’e yükleyebilirsiniz. Ayrıca, AWS Glue, müşterilerin verilerini analitik için hazırlamalarını ve yüklemelerini kolaylaştıran, tam olarak yönetilen bir ayıklama, dönüştürme ve yükleme hizmetidir. AWS Management Console’da birkaç tıklama ile AWS Glue ETL işleri oluşturup bunları çalıştırabilirsiniz.

S: Başlangıçta Amazon Redshift’e yüklenmesi gereken çok verim var. İnternet üzerinden aktarmam uzun sürer. Bu verileri nasıl yükleyebilirim?

AWS Import/Export’u kullanarak taşınabilir depolama araçları üzerinden Amazon S3’e veri aktarabilirsiniz. Ayrıca, AWS Direct Connect’i kullanarak ağınız ya da veri merkeziniz ile AWS arasında özel bir ağ bağlantısı kurabilirsiniz. Verilerinizi aktarmak için 1 Gbit/sn veya 10 Gbit/sn bağlantı noktalarından birini seçebilirsiniz.

Güvenlik

S: Amazon Redshift, veri kaynağımı nasıl güvenli tutar?

Amazon Redshift, entegre AWS IAM entegrasyonu, tek oturum açma için kimlik federasyonu (SSO), çok faktörlü kimlik doğrulama, sütun düzeyinde erişim kontrolü, Amazon Virtual Private Cloud (Amazon VPC) ile sektör lideri güvenliği destekler ve taşıma sırasında ve beklemedeyken verilerinizi korumak için entegre AWS KMS entegrasyonu sağlar. Amazon Redshift, endüstri standardı şifreleme tekniklerini kullanarak verilerinizi şifreler ve hem aktarım hem bekleme sırasında güvenli tutar. Amazon Redshift, aktarım sırasında verilerin güvenli tutulması için istemci uygulamanızla Redshift veri ambarı kümeniz arasında SSL özellikli bağlantıları destekler. Verilerinizin beklerken güvenli tutulması için Amazon Redshift tarafından veriler diske yazılırken donanım hızlandırmalı AES-256 kullanılarak her bir blok şifrelenir. Bu işlemler, ara sorgu sonuçları dahil olmak üzere diske yazılan her şeyi şifreleyen G/Ç alt sisteminin düşük bir düzeyinde gerçekleşir. Bloklar olduğu gibi yedeklendiğinden, yedekler de şifreli olur. Amazon Redshift varsayılan olarak anahtar yönetimini üstlenir ancak anahtarlarınızı AWS Key Management Service aracılığıyla yönetmeyi tercih edebilirsiniz. Tüm Amazon Redshift güvenlik özellikleri hiçbir ek ücret olmadan sunulur. Redshift Spectrum, kendi hesabınızın AWS Key Management Service (KMS) tarafından yönetilen varsayılan anahtarını kullanarak Amazon S3’ün Sunucu Tarafı Şifreleme (SSE) özelliğini destekler.

S: Redshift, sütun düzeyinde güvenlik gibi ayrıntılı erişim kontrollerini destekliyor mu?

Evet. Ayrıntılı sütun düzeyi güvenlik denetimleri, kullanıcıların yalnızca erişimi olması gereken verileri görmesini sağlar. Amazon Redshift, yerel tablolar için sütun düzeyinde erişim kontrolünü destekler ve böylece bir kullanıcıya veya kullanıcı grubuna sütun düzeyinde ayrıcalıklar vererek/bunları iptal ederek tablonun veya görünümün her bir sütununa erişimi kontrol edebilirsiniz. Redshift, AWS Lake Formation ile entegre olarak Lake Formation’ın sütun düzeyi erişim denetimlerinin data lake'teki verilerde yürütülen Redshift sorgularına da uygulanmasını sağlar.

S: Redshift, tek oturum açmayı destekliyor mu?

Evet. Microsoft Azure Active Directory, Active Directory Federation Services, Okta, Ping Federate veya diğer SAML uyumlu kimlik sağlayıcıları gibi kurumsal kimlik sağlayıcılarını kullanmak isteyen müşteriler, Amazon Redshift’i tek oturum açma sağlayacak şekilde yapılandırabilir.

S: Redshift, Microsoft Azure Active Directory ile tek oturum açmayı nasıl destekler?

Microsoft Azure Active Directory (AD) kimlikleriyle Amazon Redshift kümesinde oturum açabilirsiniz. Bu, Redshift’te Azure Active Directory kimliklerini çoğaltmadan Redshift’te oturum açabilmenizi sağlar.

S: Amazon Redshift, çok faktörlü kimlik doğrulamayı (MFA) destekliyor mu?

Evet. Amazon Redshift kümenizde kimlik doğrulaması yaparken ek güvenlik için çok faktörlü kimlik doğrulamayı (MFA) kullanabilirsiniz.

S: Amazon Redshift’i Amazon Virtual Private Cloud’da (Amazon VPC) kullanabilir miyim?

Evet, Amazon Redshift’i VPC yapılandırmanızın bir parçası olarak kullanabilirsiniz. Amazon VPC ile kendi veri merkezinizde çalıştırabileceğiniz geleneksel bir ağa çok benzeyen bir sanal ağ topolojisi tanımlayabilirsiniz. Bu sayede Amazon Redshift veri ambarı kümenize kimlerin erişebileceği konusunda tam denetime sahip olursunuz. Redshift Spectrum’u VPC’nizin parçası olan bir Amazon Redshift kümesi ile kullanabilirsiniz.

S: Amazon Redshift işlem düğümlerime doğrudan erişebilir miyim?

Hayır. Amazon Redshift işlem düğümleriniz özel bir ağ alanındadır ve bunlara yalnızca veri ambarı kümenizin baş düğümünden erişilebilir. Bu mekanizma, verileriniz için ek bir güvenlik katmanı sağlar.

Erişilebilirlik ve dayanıklılık

S: Bir düğümümdeki sürücülerden biri başarısız olursa veri ambarı kümemin erişilebilirliği ve veri dayanıklılığı bundan nasıl etkilenir?

Amazon Redshift, veri ambarı kümenizde başarısız olan düğümü otomatik olarak algılayıp değiştirir. Yedek bir düğüm tedarik edilip veritabanına eklenene kadar veri ambarı kümesi sorgulara ve güncelleştirmelere kapalı olur. Amazon Redshift, yedek düğümünüzü anında erişilebilir hale getirir ve verilerinizi olabildiğince hızlı bir şekilde sorgulamaya başlayabilmeniz için S3’ten önce en sık erişilen verileri yükler. Tek düğümlü kümeler veri replikasyonunu desteklemez. Bir sürücünün başarısız olması durumunda kümeyi S3’teki anlık yedekten geri yüklemeniz gerekir. Üretim için en az iki düğüm kullanılmasını öneririz.

S: Tek bir düğüm başarısız olursa veri ambarı kümemin erişilebilirliği ve veri dayanıklılığı bundan nasıl etkilenir?

Amazon Redshift, veri ambarı kümenizde başarısız olan düğümü otomatik olarak algılayıp değiştirir. Yedek bir düğüm tedarik edilip veritabanına eklenene kadar veri ambarı kümesi sorgulara ve güncelleştirmelere kapalı olur. Amazon Redshift, yedek düğümünüzü anında erişilebilir hale getirir ve verilerinizi olabildiğince hızlı bir şekilde sorgulamaya başlayabilmeniz için S3’ten önce en sık erişilen verileri yükler. Tek düğümlü kümeler veri replikasyonunu desteklemez. Bir sürücünün başarısız olması durumunda kümeyi S3’teki anlık yedekten geri yüklemeniz gerekir. Üretim için en az iki düğüm kullanılmasını öneririz.

S: Veri ambarı kümemin Erişilebilirlik Alanı’nda (AZ) bir kesinti yaşanırsa veri ambarı kümemin erişilebilirliği ve veri dayanıklılığı bundan nasıl etkilenir?

Amazon Redshift veri ambarı kümenizin Erişilebilirlik Alanı erişilemez hale gelirse AZ’de güç ve ağ erişimi yeniden sağlanana kadar kümenizi kullanamazsınız. AZ yeniden erişilebilir hale geldiğinde Amazon Redshift veri ambarınızı hemen kullanmaya başlayabilmeniz için veri ambarı kümenizin verileri korunur. Ayrıca, anlık yedekleriniz varsa bunları aynı bölgedeki yeni bir AZ’ye geri yüklemeyi de tercih edebilirsiniz. Amazon Redshift, olabildiğince hızlı bir şekilde sorgu gerçekleştirmeye devam edebilmeniz için önce en sık erişilen verilerinizi geri yükler.

S: Amazon Redshift, Multi-AZ Dağıtımları destekler mi?

Amazon Redshift şu an yalnızca Single-AZ dağıtımları destekler. Aynı Amazon S3 giriş dosyalarından ayrı AZ’lerdeki iki Amazon Redshift veri ambarı kümesine veri yükleyerek birden çok AZ'de veri ambarı kümesi çalıştırabilirsiniz. Redshift Spectrum ile farklı AZ’lerde birden çok küme başlatabilir ve Amazon S3’teki verileri kümenize yüklemenize gerek kalmadan bunlara erişebilirsiniz. Ayrıca, bir veri ambarı kümesini, veri ambarı kümesi anlık yedeklerinizden farklı bir AZ’ye yükleyebilirsiniz.

Yedekleme ve geri yükleme

S: Amazon Redshift, verilerimi nasıl yedekler? Kümemi bir yedekten nasıl geri yükleyebilirim?

Amazon Redshift, yüklendiğinde veri ambarı kümenizdeki tüm verileri çoğaltmasının verilerinizi yanı sıra sürekli olarak Amazon S3’te yedekler. Amazon Redshift, her zaman verilerinizin en az üç kopyasını (işlem düğümlerinde özgün kopya ve replika, Amazon S3’te bir yedek) tutmaya çalışır. Redshift olağanüstü durum kurtarma için anlık yedeklerinizi zaman uyumsuz olarak bir başka bölgedeki S3'e de çoğaltabilir.

Amazon Redshift varsayılan olarak veri ambarı kümeniz için 1 günlük bir tutma dönemiyle otomatik yedeklemeyi etkinleştirir. Bu süre 35 güne kadar uzayacak şekilde yapılandırılabilir.

Ücretsiz yedek depolama alanı, veri ambarı kümesindeki düğümlerin toplam depolama boyutuyla sınırlıdır ve yalnızca etkin veri ambarı kümeleri için geçerlidir. Örneğin, toplam 8 TB veri ambarı depolama alanınız varsa ücretsiz olarak en fazla 8 TB yedek depolama alanı sağlarız. Yedeklerinizin tutulma süresini bir günden uzun yapmak istiyorsanız AWS Management Console ya da Amazon Redshift API’lerini kullanarak bunu yapabilirsiniz. Otomatik anlık yedekler hakkında daha fazla bilgi edinmek için lütfen Amazon Redshift Yönetim Kılavuzu’na bakınız. Amazon Redshift yalnızca değişen verileri yedeklediğinden, çoğu anlık yedek ücretsiz depolama alanınızın küçük bir miktarını kullanır.

Bir yedeği geri yüklemeniz gerektiğinde, yedek tutma aralığınız içinde tüm otomatik yedeklere erişebilirsiniz. Geri yüklenecek yedeği seçtiğinizde, yeni bir veri ambarı kümesi tedarik eder ve verilerinizi buna geri yükleriz.

S: Otomatik yedeklerimin ve anlık yedeklerimin tutulduğu süreyi nasıl yönetirim?

Otomatik yedeklerinizin tutulduğu süreyi AWS Management Console veya ModifyCluster API'si ile RetentionPeriod parametresini değiştirerek yönetebilirsiniz. Otomatik yedeklemeyi tamamen kapatmak istiyorsanız tutma dönemini 0 değerine ayarlayabilirsiniz (önerilmez).

S: Veri ambarı kümemi silersem yedeklerime ne olur?

Bir veri ambarı kümesini sildiğinizde, silme işleminin üzerine son bir anlık yedeğin oluşturulup oluşturulmayacağını belirtme olanağınız vardır. Bu, silinen veri ambarı kümesinin daha sonra geri yüklenmesine olanak sağlar. Veri ambarı kümenizin daha önce manuel olarak oluşturulmuş tüm anlık yedekleri korunur ve bunları silmediğiniz sürece standart Amazon S3 fiyatları üzerinden faturalandırma devam eder.

Ölçeklenebilirlik

S: Amazon Redshift veri ambarı kümemin boyutunu ve performansını nasıl ölçeklendirebilirim?

Sorgu performansını artırmak veya fazla CPU, bellek ya da G/Ç kullanımına yanıt vermek istiyorsanız AWS Management Console veya ModifyCluster API’si aracılığıyla Esnek Yeniden Boyutlandırma’yı kullanarak veri ambarı kümenizdeki düğümlerin sayısını artırabilirsiniz. Veri ambarı kümenizi değiştirdiğinizde istediğiniz değişiklikler anında uygulanır. Amazon Redshift veri ambarı kümenize yönelik işlem kullanımı, depolama kullanımı ve okuma/yazma trafiğine ilişkin ölçümlere AWS Management Console veya Amazon CloudWatch API’leri aracılığıyla ücretsiz olarak erişebilirsiniz. Amazon Cloudwatch özel ölçüm işlevi aracılığıyla, kullanıcı tarafından tanımlanmış başka ölçümler ekleyebilirsiniz.

Eş Zamanlı Ölçeklendirme özelliği sayesinde neredeyse sınırsız sayıda kullanıcıyı ve eş zamanlı sorguyu, sürekli hızlı sorgu performansıyla destekleyebilirsiniz. Eş zamanlı ölçeklendirme etkinleştirilince, eş zamanlı okuma sorgularındaki bir artışı işlemek için ihtiyacınız olduğunda Amazon Redshift otomatik olarak ek küme kapasitesi ekler.

Redshift Spectrum ile Amazon S3’te depolanan aynı verilere erişen birden çok Amazon Redshift kümesi çalıştırabilirsiniz. Farklı kullanım örnekleri için farklı kümeler kullanabilirsiniz. Örneğin, bir kümeyi standart raporlama için kullanırken başka bir kümeyi veri bilimi sorguları için kullanabilirsiniz. Pazarlama ekibiniz, operasyon ekibinizin kümelerinden farklı olarak kendi kümelerini kullanabilir. Redshift Spectrum, Amazon S3’ten gelen verileri okumak ve işlemek için sorgunuzun yürütülmesini otomatik olarak paylaşılan bir kaynak havuzundan birkaç Redshift Spectrum çalışanına dağıtır ve kalan işlemler için sonuçları tekrar Amazon Redshift kümenize çeker.

S: Ölçeklendirme sırasında veri ambarı kümem erişilebilir kalır mı?

Duruma bağlı. Eş Zamanlı Ölçeklendirme özelliği kullanılırken eş zamanlı ölçeklendirme esnasında küme, okuma ve yazma için tam olarak erişilebilir durumdadır. Esnek yeniden boyutlandırma ile dört ila sekiz dakika süren yeniden boyutlandırma esnasında küme erişilebilir olmaz. Yönetilen depolamada Redshift RA3 depolama esnekliğiyle küme tam olarak erişilebilirdir ve veriler, yönetilen depolama ve işlem düğümleri arasında otomatik olarak taşınır.

Eş Zamanlılık

S: Redshift kümemin eş zamanlılığın yüksek olduğu anlarda bile tutarlı bir şekilde hızlı performans sunacağından emin olmak için kaynaklarımı nasıl yönetmeliyim?

Normal bir veri ambarında eş zamanlı olarak kullanılan sorgu miktarı gün içinde büyük ölçüde değişiklik gösterir. En yüksek talebe göre kaynak sağlamaktansa, yalnızca gerekli aralıklar için kaynak eklemek daha uygun maliyetlidir. Amazon RedShift, bunu sizin için otomatik olarak halleder.

Eş Zamanlı Ölçeklendirme, binlerce eş zamanlı sorgu söz konusu olduğunda dahi tutarlı olarak hızlı sorgu performansı sunan bir Amazon Redshift özelliğidir. Bu özellik sayesinde Amazon Redshift, gerektiğinde yoğun talebi karşılamak üzere otomatik olarak geçici kapasite ekler. Amazon Redshift otomatik olarak sorguları ölçeklendirme kümelerine yönlendirir. Bu kümeler saniyeler içinde sağlanır ve anında sorguları işlemeye başlar.

Bu özellik çoğu müşteriye ücretsiz olarak sunulur. Tüm Amazon Redshift kümeleri, günde bir saate kadar ücretsiz Eş Zamanlı Ölçeklendirme kredisi kazanır. Bu sayede, analiz talebinin dalgalandığı dönemlerde bile aylık masraflarınızı öngörebilirsiniz.

S: Esnek Yeniden Boyutlandırma nedir ve Eş Zamanlı Ölçeklendirme ile arasında ne fark vardır?

Esnek Yeniden Boyutlandırma, tek bir Redshift kümesindeki düğümleri dakikalar içinde ekleyerek veya kaldırarak sorgu performansını yönetir. Örneğin, günün belirli saatlerine veya ay sonu raporlamasına yönelik bir ETL iş yükünün zamanında tamamlanabilmesi için ek Redshift kaynakları gerekebilir. Eş Zamanlı Ölçeklendirme, daha fazla küme kaynağı ekleyerek genel sorgu eş zamanlılığını artırır.

S: Eş Zamanlı Ölçeklendirme kümelerine doğrudan erişebilir miyim?

Hayır. Eş Zamanlı Ölçeklendirme, Redshift kaynaklarından oluşan ve çok büyük oranda ölçeklendirilebilen bir havuzdur ve müşteriler buna doğrudan erişemez.

Sorgulama ve analiz

S: Amazon Redshift ve Redshift Spectrum, tercih ettiğim iş zekası yazılım paketi ve ETL araçlarıyla uyumlu mudur?

Endüstri standardı SQL kullanan Amazon Redshift’e standart JDBC ve ODBC sürücüleri kullanılarak erişilir. Amazon Redshift özel JDBC ve ODBC sürücülerini Redshift Console’un Connect Client (İstemci Bağlama) sekmesinden indirebilirsiniz. Popüler BI ve ETL satıcılarıyla olan entegrasyonumuzu doğruladık ve bunların bazıları, verilerinizi yükleyip analiz etmeye başlamanıza yardımcı olmak için ücretsiz denemeler sunuyor. Dilerseniz AWS Marketplace’e giderek Amazon Redshift ile çalışacak şekilde tasarlanmış çözümleri dakikalar içinde dağıtıp yapılandırabilirsiniz.

Redshift Spectrum, tüm Amazon Redshift istemci araçlarını destekler. İstemci araçları OBDC ve JDBC bağlantıları kullanarak Amazon Redshift kümesinin uç noktasına bağlanmaya devam edebilir. Değişiklik gerekmez.

Tam olarak aynı söz dizimini kullanırsınız ve Redshift Spectrum’daki tablolara erişim için Redshift kümenizin yerel depolama alanındaki tablolarla aynı sorgulama özelliklerine sahip olursunuz. Harici tablolara, bunlar kaydedilirken kullanılan CREATE EXTERNAL SCHEMA komutunda tanımlanan şema adı kullanılarak başvurulur.

S: Redshift Spectrum hangi veri ve sıkıştırma biçimlerini destekler?

Redshift Spectrum şu anda Avro, CSV, Grok, Amazon Ion, JSON, ORC, Parquet, RCFile, RegexSerDe, Sequence, Text ve TSV dahil olmak üzere birçok açık kaynak veri biçimini destekler.

Redshift Spectrum şu an Gzip ve Snappy sıkıştırmayı destekler.

S: Yerel depolama alanımdaki bir tablo, harici bir tabloyla aynı ada sahipse ne olur?

Yerel tablolarda olduğu gibi, sorgunuzda şema adını şema_adı.tablo_adı biçiminde kullanarak tam olarak hangisini kast ettiğinizi seçebilirsiniz.

S: S3 data lake’imle ilgili meta verileri depolamak için bir Hive Metastore kullanıyorum. Redshift Spectrum’u kullanabilir miyim?

Evet. CREATE EXTERNAL SCHEMA komutu Hive Metastore’ları destekler. Şu anda Hive Metastore’a yönelik DDL desteği sunmuyoruz.

S: Kümemde oluşturulan tüm harici veritabanı tablolarının listesine nasıl ulaşabilirim?

Bu bilgiyi edinmek için SVV_EXTERNAL_TABLES adlı sistem tablosunu sorgulayabilirsiniz.

İzleme

S: Amazon Redshift veri ambarı kümemin performansını nasıl izleyebilirim?

Amazon Redshift veri ambarı kümenize yönelik işlem kullanımı, depolama kullanımı ve okuma/yazma trafiğine ilişkin ölçümlere AWS Management Console veya Amazon CloudWatch API’leri aracılığıyla ücretsiz olarak erişebilirsiniz. Amazon Cloudwatch’un özel ölçüm işlevi aracılığıyla, kullanıcı tarafından tanımlanmış başka ölçümler ekleyebilirsiniz. AWS Management Console, tüm kümelerinizin durumunu ve performansını izlemenize yardımcı olacak bir izleme panosu sağlar. Amazon Redshift ayrıca AWS Management Console aracılığıyla sorgu ve küme performansıyla ilgili bilgi sağlar. Bu bilgiler, sorgu planlarını ve yürütme istatistiklerini görüntüleyerek en çok sistem kaynağını hangi kullanıcıların ve sorguların tükettiğini görmenize ve performans sorunlarını tanılamanıza olanak tanır. Ayrıca, verilerinizin ve sorgularınızın tüm düğümlere dengeli bir şekilde dağıldığından emin olmak için işlem düğümlerinizin her birindeki kaynak kullanımını görebilirsiniz.

Bakım

S: Bakım aralığı nedir? S: Yazılım bakımı sırasında veri ambarı kümeme erişilebilir mi?

Amazon Redshift, düzenli aralıklarla bakım gerçekleştirerek düzeltmeleri, geliştirmeleri ve yeni özellikleri kümenize uygular. Kümeyi programlama yoluyla ya da Redshift Console’u ile değiştirerek zamanlanan bakım aralıklarını değişltirebilirsiniz. Bu bakım aralıkları sırasında Amazon Redshift kümeniz normal işlemlere kapalı olur. Bakım aralıkları ve bölgeye göre zamanlamalar hakkında daha fazla bilgi edinmek için Amazon Redshift Yönetim Kılavuzu’nun Bakım Aralıkları bölümüne bakın.

Amazon Redshift fiyatlandırması hakkında daha fazla bilgi edinin

Fiyatlandırma sayfasını ziyaret edin
Oluşturmaya hazır mısınız?
Amazon Redshift'i kullanmaya başlayın
Başka sorunuz mu var?
Bize ulaşın