Genel

S: Amazon Redshift nedir?

Amazon Redshift, hızlı ve tam olarak yönetilen bir veri ambarıdır. Standart SQL ve mevcut Business Intelligence (BI) araçlarınızı kullanarak tüm verilerinizi analiz etmenizi basitleştirir ve uygun maliyetli hale getirir. İleri düzey sorgu optimizasyonu, yüksek performanslı yerel disklerde sütunlu depolama ve yüksek hacimli paralel sorgu yürütmeyi kullanarak petabaytlarca yapılandırılmış veri üzerinde sofistike analiz sorguları yürütmenize olanak sağlar. Sonuçların çoğu saniyeler içinde döner. Redshift ile hiçbir taahhüt olmaksızın saatte yalnızca 0,25 USD karşılığında küçük ölçekte başlayabilir ve yıllık terabayt başına 1.000 USD ödeyerek geleneksel çözümlerin onda birinden daha düşük bir fiyata ölçeği petabaytlarca veriye genişletebilirsiniz. Amazon Redshift, Amazon S3'te bulunan eksabaytlarca yapılandırılmamış veri üzerinde doğrudan SQL sorguları yürütmenizi sağlayan Amazon Redshift Spectrum'u da içerir. Yükleme ya da dönüşüm gerektirmediği gibi Avro, CSV, Grok, Ion, JSON, ORC, Parquet, RCFile, RegexSerDe, SequenceFile, TextFile ve TSV gibi açık veri biçimlerini kullanabilirsiniz. Redshift Spectrum, sorgu işlem kapasitesini alınan verilere göre otomatik olarak ölçeklendirdiğinden, Amazon S3’e yönelik sorgular veri kümesi boyutundan bağımsız olarak hızlı çalışır.

Geleneksel veri ambarları, özellikle de büyük veri kümelerinin yönetilmesi için önemli ölçüde zaman ve kaynak gerektirir. Ayrıca, kendi yönettiğiniz şirket içi veri ambarlarının oluşturulması, bakımının yapılması ve büyütülmesiyle ilişkili finansal maliyet çok yüksektir. Verileriniz büyüdükçe maliyetleri yönetebilmek, ETL karmaşıklığını düşük tutmak ve iyi performans sağlamak amacıyla hangi verileri veri ambarınıza, hangilerini arşive yükleyeceğiniz konusunda sürekli bir denge bulmak zorunda kalırsınız. Amazon Redshift bir veri ambarının maliyetini ve operasyonel iş yükünü önemli ölçüde azaltmakla kalmaz. Redshift Spectrum ile çok miktarda veri, verilerin yüklenmesi gerekmeden, kendi yerel biçiminde kolayca analiz edilebilir.

Amazon Redshift, yapılandırılmış veriler üzerinde tanıdık SQL tabanlı istemcileri ve iş zekası (BI) araçları ile standart ODBC ve JDBC bağlantılarını kullanarak hızlı sorgulama özelliklerine sahip olmanızı sağlar. Sorgular birden çok fiziksel kaynağa dağıtılır ve bunlar arasında paralel hale getirilir. Amazon Redshift veri ambarının ölçeğini AWS Management Console’da birkaç tıklamayla ya da tek bir API çağrısı ile büyütüp küçültebilirsiniz. Amazon Redshift, veri ambarınıza otomatik olarak düzeltme eki uygular, ambarı yedekler ve elde edilen yedekleri kullanıcı tarafından tanımlanan bir tutma dönemi boyunca depolar. Amazon Redshift, erişilebilirliği iyileştirmek ve veri dayanıklılığını geliştirmek için çoğaltma ve sürekli yedekleme kullanmasının yanı sıra bileşen ve düğüm hatalarından otomatik olarak kurtarılabilir. Ayrıca, Amazon Redshift aktarım ve bekleme sırasında verilerinizi korumak için Amazon Virtual Private Cloud (Amazon VPC), SSL, AES-256 şifreleme ve Donanım Güvenliği Modüllerini (HSM) destekler.

Tüm Amazon Web Services hizmetlerinde olduğu gibi peşin yatırım gerekmez ve yalnızca kullandığınız kaynaklar için ücret ödersiniz. Amazon Redshift, kullandıkça ödemenize olanak tanır. Amazon Redshift’i ücretsiz olarak deneme olanağınız bile vardır.

Bölgesel Amazon Redshift erişilebilirliği için bkz. AWS Bölge Tablosu.

S: Redshift Spectrum nedir?

Redshift Spectrum, Amazon S3'te bulunan eksabaytlarca yapılandırılmamış veri üzerinde yükleme veya ETL gerekmeksizin sorgu çalıştırabilmenize olanak sağlayan bir Amazon Redshift özelliğidir. Bir sorgu gönderdiğinizde, bir sorgu planı oluşturup bunu optimize eden Amazon Redshift SQL uç noktasına gider. Amazon Redshift yerel ortamda ve Amazon S3'te bulunan verileri belirler, okunması gereken Amazon S3 verilerini en düşük miktara indirmek üzere bir plan oluşturur ve Redshift Spectrum çalışanlarının paylaşılan bir kaynak havuzu üzerinden Amazon S3'teki verileri okuyup işlemelerini talep eder.

Redshift Spectrum ölçeği gerekli durumlarda binlerce bulut sunucusu içerecek şekilde genişletilebildiğinden, veri boyutu ne olursa olsun sorgular hızlıca çalıştırılabilir. Halihazırda Amazon Redshift sorguları için yaptığınız şekilde, Amazon S3 verileriniz için de tam olarak aynı SQL'i kullanabilir ve aynı BI araçlarınızı kullanarak aynı Amazon Redshift uç noktasına bağlanabilirsiniz. Redshift Spectrum, depolama ve işlem süreçlerini ayırarak her ikisini de birbirinden bağımsız bir şekilde ölçeklendirmenize olanak sağlar. Amazon S3 Data Lake'inizi sorgulamak için ihtiyaç duyduğunuz sayıda, yüksek erişilebilirlik ve sınırsız eş zamanlılık sunan Amazon Redshift kümelerinden kurabilirsiniz. Redshift Spectrum, verilerinizi dilediğiniz yerde ve biçimde, ihtiyaç duyduğunuz anda işlemeye hazır bir şekilde depolama özgürlüğü sunar.

Bölgesel Redshift Spectrum erişilebilirliği hakkında bilgi edinmek için lütfen Amazon Redshift fiyatlandırma sayfasını ziyaret edin.

S: Amazon Redshift benim adıma neleri yönetir?

Amazon Redshift, altyapı kapasitesinin tedarik edilmesinden yedekleme ve düzeltme eki uygulama gibi sürekli yönetim görevlerinin otomatikleştirilmesine kadar bir veri ambarının kurulması, çalıştırılması ve ölçeklendirilmesi için gerekli tüm işlemleri yönetir. Amazon Redshift, hatalardan sonra kurtarma işlemi uygulamanıza yardımcı olmak için düğümlerinizi ve sürücülerinizi otomatik olarak izler. Amazon Redshift, Redshift Spectrum için işlem altyapısı, yük dengeleme ve planlamanın yanı sıra Amazon S3’te depolanan verilere yönelik sorgularınızı zamanlama ve yürütme süreçlerinin tümünü yönetir.

S: Veri ambarı ve analiz için sunulan çoğu geleneksel veritabanına kıyasla Amazon Redshift’in performansı nasıldır?

Amazon Redshift, çeşitli inovasyonlardan yararlanarak veri ambarı ve analiz iş yükleri için geleneksel veritabanlarından on kata kadar daha yüksek bir performans düzeyine ulaşır:

  • Sütunlu Veri Depolama: Amazon Redshift, verileri bir dizi satır şeklinde depolamaktansa sütunlar halinde düzenler. Sütun tabanlı sistemler, işlemlerin işlenmesi için ideal olan satır tabanlı sistemlerden farklı olarak, sorguların genellikle büyük veri kümeleri üzerinde gerçekleştirilen toplama işlemleri gerektirdiği veri ambarı ve analiz iş yükleri için idealdir. Yalnızca sorgularla ilgili sütunlar işlendiğinden ve sütunlu veriler depolama medyasında sıralı olarak depolandığından, sütun tabanlı sistemler çok daha az G/Ç gerektirerek sorgu performansını önemli ölçüde artırır.
  • Gelişmiş Sıkıştırma: Diskte benzer veriler sıralı olarak depolandığından, sütunlu veri depoları satır tabanlı veri depolarından çok daha fazla sıkıştırılabilir. Amazon Redshift birden çok sıkıştırma tekniği kullanır ve çoğu zaman geleneksel ilişkisel veri depolarına kıyasla önemli bir sıkıştırma oranına ulaşabilir. Bunlara ek olarak, Amazon Redshift dizin veya gerçekleştirilmiş görünümler gerektirmez ve bu sayede geleneksel ilişkisel veritabanı sistemlerinden daha az alan kullanır. Boş bir tabloya veri yüklenirken Amazon Redshift otomatik olarak verilerinizden örnek toplar ve en uygun sıkıştırma şemasını seçer.
  • Yüksek Hacimli Paralel İşleme (MPP): Amazon Redshift, veri ve sorgu yükünü otomatik olarak tüm düğümlere dağıtır. Amazon Redshift, veri ambarınıza düğüm eklemeyi kolaylaştırır ve veri ambarınız büyürken hızlı sorgu performansını korumanıza olanak tanır.
  • Redshift Spectrum: Redshift Spectrum, Amazon S3’teki eksabaytlarca veri üzerinde sorgu çalıştırmanızı sağlar. Yükleme veya ETL gerekmez. Verilerinizin hiçbirini Amazon Redshift’te depolamasanız bile Redshift Spectrum’u kullanarak Amazon S3’te depolanan 1 eksabayta kadar boyutlu veri kümelerini sorgulayabilirsiniz. Bir sorgu gönderdiğinizde, bir sorgu planı oluşturan Amazon Redshift SQL uç noktasına gider. Amazon Redshift yerel ortamda ve Amazon S3'te bulunan verileri belirler, okunması gereken Amazon S3 verilerini en düşük miktara indirmek üzere bir plan oluşturur, Redshift Spectrum çalışanlarının paylaşılan bir kaynak havuzu üzerinden Amazon S3'teki verileri okuyup işlemesini talep eder ve geriye kalan işlemler için sonuçları Amazon Redshift kümenize geri alır.

S: Amazon Redshift’i kullanmaya nasıl başlarım?

Amazon Redshift ayrıntı sayfasından veya AWS Management Console üzerinden kaydolarak dakikalar içinde kullanmaya başlayabilirsiniz. AWS hesabınız yoksa bir hesap oluşturmanız istenir.

Redshift Spectrum’u kullanabilmeniz için önce verilerinizi Amazon S3’te depolamanız gerekir. Daha sonra Amazon Redshift kümenizde bu verilerle ilgili meta verileri tanımlayabilir ya da zaten Hive meta deponuzda olan meta veriler varsa bunları kümenize kaydedebilirsiniz. Kataloğunuzdaki bir veritabanını Amazon Redshift’te harici bir şema olarak tanımlamak veya kaydetmek için Amazon Redshift kümenizde CREATE EXTERNAL SCHEMA SQL komutunu çalıştırabilirsiniz. Daha sonra, yerel tablolar ve şu anda Amazon Redshift’i destekleyen herhangi bir BI aracı için kullandığınız SQL’in aynısını kullanarak Amazon S3’e yönelik sorgu çalıştırabilirsiniz. Amazon Redshift SQL’i kullanarak oluşturduğunuz dış veritabanı tanımı, Amazon Athena’nın kullandığı veri kataloğunun aynısına kaydedilir. İsteğe bağlı olarak dış veritabanı tanımını Amazon Athena Kataloğu’ndan da yönetebilirsiniz.

Amazon Redshift’i nasıl ücretsiz deneyebileceğinizi öğrenmek için Kullanmaya Başlama sayfamıza bakın.

S: Bir Amazon Redshift veri ambarı kümesi oluşturup buna nasıl erişebilirim?

AWS Management Console’u ya da Amazon Redshift API’lerini kullanarak kolayca bir Amazon Redshift veri ambarı kümesi oluşturabilirsiniz. Tek düğümlü, 160 GB boyutlu bir veri ambarıyla kullanmaya başlayabilir ve AWS Console’da birkaç tıklamayla ya da tek bir API çağrısıyla ölçeği petabayt ölçeğine veya onun da üzerine çıkarabilirsiniz.

Tek düğümlü yapılandırma, Amazon Redshift’i hızla ve uygun maliyetli bir şekilde kullanmaya başlayıp gereksinimleriniz büyüdükçe ölçeği çok düğümlü bir yapılandırmaya büyütmenize olanak tanır. Bir Redshift veri ambarı kümesi, düğüm türüne bağlı olarak 1 ila 128 işlem düğümü içerebilir. Ayrıntılar için lütfen belgelerimize bakın.

Çok düğümlü yapılandırma, istemci bağlantılarını yöneten ve sorguları alan bir baş düğümün yanı sıra verileri depolayıp sorguları ve hesaplamaları gerçekleştiren iki işlem düğümü gerektirir. Baş düğüm sizin adınıza otomatik olarak tedarik edilir ve bunun için ücret ödemezsiniz.

Tek yapmanız gereken, tercih ettiğiniz Erişilebilirlik Alanı’nı (isteğe bağlı), düğüm sayısını, düğüm türlerini, bir ana adı ve parolayı, güvenlik gruplarını, yedek tutma tercihlerinizi ve diğer sistem ayarlarını belirtmektir. İstediğiniz yapılandırmayı seçtiğinizde, Amazon Redshift gerekli kaynakları tedarik eder ve veri ambarı kümenizin kurulumunu yapar.

Veri ambarı kümeniz erişilebilir hale geldiğinde AWS Management Console’dan ya da Redshift API’lerini kullanarak kümenin JDBC ve ODBC bağlantı dizesini alabilirsiniz. Daha sonra bu bağlantı dizesini en sevdiğiniz veritabanı aracı, programlama dili veya İş Zekası (BI) aracıyla kullanabilirsiniz. Çalışmakta olan veri ambarı kümenize yönelik ağ isteklerini yetkilendirmeniz gerekir. Ayrıntılı bir açıklama için lütfen Kullanmaya Başlama Kılavuzumuza başvurun.

S: Baş düğüm ne yapar? İşlem düğümü ne yapar?

Baş düğüm, istemci uygulamalarından sorguları alıp ayrıştırır ve bu sorguların işlenmesi için bir dizi sıralı adımdan oluşan yürütme planlarını geliştirir. Baş düğüm daha sonra bu planların işlem düğümleriyle paralel olarak yürütülmesini koordine eder, bu düğümlerden gelen ara sonuçları toplar ve son olarak sonuçları istemci uygulamalarına döndürür.

İşlem düğümleri, yürütme planlarında belirtilen adımları yürütür ve bu sorguların yanıtlanması için kendi aralarında veri aktarır. Ara sonuçlar istemci uygulamalarına gönderilmeden önce toplanmak üzere baş düğüme geri gönderilir.

S: İşlem düğümü başına maksimum depolama kapasitesi ne kadardır? En uygun performans için işlem düğümü başına önerilen veri miktarı nedir?

Yoğun Depolama (DS) düğüm türlerine veya Yoğun İşlem (DC) düğüm türlerine sahip bir küme oluşturabilirsiniz. Yoğun Depolama düğüm türleri, sabit disk sürücüleri (HDD) kullanarak çok düşük ücretle çok büyük veri ambarları oluşturmanıza olanak sağlar. Yoğun İşlem düğüm türleri, hızlı CPU'lar, büyük miktarda RAM ve katı hal diskleri (SSD) kullanarak çok yüksek performanslı veri ambarları oluşturmanıza olanak sağlar.

Yoğun Depolama (DS) düğüm türleri, Ekstra Büyük ve Sekiz Kat Ekstra Büyük şeklindeki iki boyutta sunulur. Ekstra Büyük (XL) seçeneğinde toplam 2 TB manyetik depolama alanına sahip 3 HDD yer alırken, Sekiz Kat Ekstra Büyük (8XL) seçeneğinde toplam 16 TB manyetik depolama alanına sahip 24 HDD vardır. DS2.8XLarge seçeneğinde 36 Intel Xeon E5-2676 v3 (Haswell) sanal çekirdek ve 244 GiB RAM, DS2.XL seçeneğinde ise 4 Intel Xeon E5-2676 v3 (Haswell) sanal çekirdek ve 31 GiB RAM vardır. Daha fazla ayrıntı için lütfen fiyatlandırma sayfamıza bakın. Saatte 0,85 USD karşılığında 2 TB boyutlu tek bir Ekstra Büyük düğümle çalışmaya başlayabilir ve ölçeği petabayt düzeyine veya onun da üzerine çıkacak şekilde büyütebilirsiniz. Saatlik olarak ödeme yapabilir ya da rezerve edilmiş bulut sunucusu fiyatlandırmasından yararlanarak ödediğiniz ücreti yıllık TB başına 1.000 USD’nin altına düşürebilirsiniz.

Yoğun İşlem (DC) düğüm türleri de iki boyutta sunulmaktadır. Büyük seçeneği 160 GB SSD depolama, 2 Intel Xeon E5-2670v2 (Ivy Bridge) sanal çekirdek ve 15 GiB RAM içerir. Bunun on altı katı olan Sekiz Kat Ekstra Büyük, 2,56 TB SSD depolama, 32 Intel Xeon E5-2670v2 sanal çakirdek ve 244 GiB RAM içerir. Saatlik 0,25 USD karşılığında tek bir DC2 Büyük ile çalışmaya başlayabilir ve ölçeği tam 326 TB SSD depolama, 3.200 sanal çekirdek ve 24 TiB RAM içeren 128 8XL’ye kadar genişletebilirsiniz.

Amazon Redshift'in MPP mimarisi, veri ambarı kümenizdeki düğüm sayısını artırarak performansınızı artırabileceğiniz anlamına gelir. İşlem düğümü başına en uygun veri miktarı, uygulamanızın özelliklerine ve sorgu performansı gereksinimlerinize bağlıdır. Bir Amazon Redshift veri ambarı kümesi, düğüm türüne bağlı olarak 1 ila 128 işlem düğümü içerebilir. Ayrıntılar için lütfen belgelerimize bakın.

S: Hangi durumlarda Amazon RDS yerine Amazon Redshift kullanmalıyım?

Hem Amazon Redshift hem de Amazon RDS, veritabanı yönetim yükünü devrederek geleneksel ilişkisel veritabanları çalıştırmanıza olanak tanır. Müşteriler, Amazon RDS veritabanlarını hem çevrimiçi işlem gerçekleştirme (OLTP) hem de raporlama ve analiz için kullanır. Amazon Redshift, birden çok düğümün ölçeğinden ve kaynaklarından yararlanmasının yanı sıra çeşitli optimizasyonlar kullanarak çok büyük veri kümeleri üzerinde analiz ve raporlama iş yükleri için geleneksel veritabanlarına kıyasla performansı bir üst düzeye taşır. Amazon Redshift, verilerinizin boyutu ve sorgularınızın karmaşıklığı arttıkça ya da raporlama ve analiz işlemlerinizin OLTP iş yükünüzün performansını etkilemesini engellemek amacıyla ölçek genişletmek için harika bir seçenek sunar.

S: Hangi durumlarda Amazon EMR yerine Amazon Redshift veya Redshift Spectrum kullanmalıyım?

Apache Spark, Hadoop, Presto veya Hbase gibi büyük veri işleme framework’leriyle son derece büyük veri kümelerini işlemek ve analiz etmek için özel kod kullanıyorsanız Amazon EMR’yi kullanmalısınız. Amazon EMR, kümelerinizin yapılandırması ve kümelerinize yüklediğiniz yazılımlar konusunda tam denetime sahip olmanızı sağlar.

Amazon Redshift gibi veri ambarları, tamamen farklı türde bir analiz için tasarlanmıştır. Veri ambarlarının tasarım amacı, envanter, finans ve perakende satış sistemleri gibi birçok farklı kaynaktan alınan verilerin bir araya toplanmasıdır. Şirket genelinde raporlamanın tutarlı bir şekilde doğru olmasının sağlanması için veri ambarları, verileri yüksek oranda yapılandırılmış bir şekilde depolar. Bu yapı, doğrudan veritabanı tablolarında yerleşik olarak veri tutarlılığı kuralları uygulanmasını sağlar. Devasa büyüklükteki yapılandırılmış veri koleksiyonları üzerinde karmaşık sorgular gerçekleştirmenizi ve son derece hızlı performansa sahip olmanızı gerektiren durumlarda kullanılacak en iyi hizmet Amazon Redshift’tir.

Amazon Redshift ve S3’teki veriler üzerinde sorgu çalıştırmak için Redshift Spectrum harika bir seçenek olsa da genellikle kurumların Amazon EMR gibi işleme framework’lerinden beklediği kullanım örnekleri için pek uygun değildir. Amazon EMR, SQL sorguları çalıştırmanın çok daha ötesine gider. Amazon EMR, tam olarak özelleştirilebilir kümelerde Spark, Hadoop ve Presto gibi popüler büyük veri işleme framework’lerinin en son sürümlerini kullanarak son derece büyük veri kümelerini işlemenize ve analiz etmenize olanak tanıyan, yönetilen bir hizmettir. Amazon EMR ile makine öğrenimi, grafik analizi, veri dönüşümü, veri akışı gibi uygulamalar ve kodunu yazabileceğiniz neredeyse her şey için birçok farklı çeşit ölçeği genişletilebilir veri işleme görevi çalıştırabilirsiniz.

Redshift Spectrum’u EMR ile birlikte kullanabilirsiniz. Redshift Spectrum, tablo tanımlarını depolamak için Amazon EMR ile aynı yaklaşımı kullanır. Redshift Spectrum, verileri ve tablo tanımlarını bulmak için Amazon EMR tarafından kullanılan Apache Hive Metastore’u destekleyebilir. Amazon EMR hizmetini kullanıyorsanız ve zaten bir Hive Metastore’unuz varsa tek yapmanız gereken, Amazon Redshift kümenizi bunu kullanacak şekilde yapılandırmaktır. Daha sonra Amazon EMR i̇şlerinizin yanı sıra bu verileri doğrudan sorgulamaya başlayabilirsiniz. Özetle, büyük bir veri deposunu kullanmak için zaten EMR hizmetini kullanıyorsanız Redshift Spectrum’u tam olarak bununla aynı anda, Amazon EMR işlerinize engel olmaksızın kullanarak verileri sorgulayabilirsiniz.

Sorgu hizmetleri, veri ambarları ve karmaşık veri işleme framework’leri birbirinden farklıdır ve farklı amaçlar için kullanılır. İş için doğru aracı seçmeniz yeterli.

 

S: Hangi durumlarda Redshift Spectrum yerine Amazon Athena’yı kullanmalıyım?

Amazon Athena, dilediğiniz çalışana Amazon S3’teki veriler üzerinde anlık sorgular çalıştırma olanağı sağlamanın en basit yoludur. Athena sunucusuz olduğundan kurmanız veya yönetmeniz gereken bir altyapı yoktur. Athena ile verilerinizi hemen analiz etmeye başlayabilirsiniz.

Tutarlı, yüksek oranda yapılandırılmış bir biçimde depolanması gereken, sık erişilen verileriniz varsa Amazon Redshift gibi bir veri ambarı kullanmalısınız. Bu sayede, Amazon Redshift’teki yapılandırılmış, sık erişilen verileri depolama ve Redshift Spectrum’u kullanarak Amazon Redshift sorgularınızı Amazon S3 data lake’inizdeki veri evreninin tamamını kapsayacak şekilde genişletme esnekliğine sahip olursunuz. Böylece, verilerinizi dilediğiniz yerde ve biçimde, ihtiyaç duyduğunuz anda işlemeye hazır bir şekilde depolama özgürlüğünüz olur.

S: Amazon EC2’de kendi MPP veri ambarı kümemi çalıştırmak yerine neden Amazon Redshift’i kullanmalıyım?

Amazon Redshift, aşağıdakiler dahil olmak üzere kendi veri ambarınızı yönetmenin getirdiği, zaman alan birçok görevi otomatik olarak yerine getirir:

  • Kurulum: Amazon Redshift ile verilerinizi yükleyip sorgulamaya başlamak için tek yapmanız gereken bir veri ambarı kümesi oluşturma ve şemanızı tanımlamaktır. Tedarik, yapılandırma ve düzeltme eki uygulama işlemlerinin tümü sizin yerinize yönetilir.
  • Veri Dayanıklılığı: Amazon Redshift, verilerinizi veri ambarı kümenizin içinde çoğaltır ve on bir dokuzluk dayanıklılık sağlayacak şekilde tasarlanmış Amazon S3’e sürekli olarak yedekler. Amazon Redshift, her bir sürücüde yer alan verileri kümenizdeki diğer düğümlere yansıtır. Bir sürücü başarısız olursa sorgularınız, Redshift’in replikalardan sürücünüzü yeniden oluşturması sırasında oluşan küçük bir gecikme süresi artışıyla da olsa devam eder. Düğüm hatası söz konusu olduğunda, Amazon Redshift otomatik olarak yeni düğüm tedarik eder ve kümenin içindeki diğer düğümlerden ya da Amazon S3’ten verileri geri yüklemeye başlar. En sık yürütülen sorgularınızın hızla çalışır hale gelmesi için en sık sorguladığınız verilerin geri yüklenmesine öncelik verir.
  • Ölçeklendirme: Kapasite ve performans gereksinimleriniz değiştikçe Amazon Redshift veri ambarı kümenizde tek bir API çağrısıyla veya AWS Management Console’da birkaç tıklamayla düğüm ekleyip kaldırabilirsiniz.
  • Otomatik Güncelleştirme ve Düzeltme Eki Uygulama: Amazon Redshift, yükseltmeleri ve düzeltme eklerini otomatik bir biçimde veri ambarınıza uygulayarak uygulamanızın yönetimine değil, kendisine odaklanmanızı mümkün kılar.
  • Eksabayt Ölçeğinde Sorgu Olanağı: Redshift Spectrum, Amazon S3’teki eksabaytlarca veri üzerinde sorgu çalıştırmanızı sağlar. Yükleme veya ETL gerekmez. Verilerinizin hiçbirini Amazon Redshift’te depolamasanız bile Redshift Spectrum’u kullanarak Amazon S3’te depolanan 1 eksabayta kadar boyutlu veri kümelerini sorgulayabilirsiniz.

Faturalandırma

S: Amazon Redshift kullanımım için hangi ücretleri öderim ve nasıl faturalandırılırım?

Yalnızca kullandığınız kadar ödersiniz ve minimum ücret veya kurulum ücreti yoktur. Bir veri ambarı kümesi, küme erişilebilir olduğu andan itibaren faturalandırılmaya başlanır. Faturalandırma, veri ambarı kümesi sonlandırılana (bulut sunucusu silindiğinde veya başarısız olduğunda gerçekleşebilir) kadar devam eder. Şunlar temel alınarak faturalandırılırsınız:

  • İşlem düğümü saati: İşlem düğümü saatleri, faturalandırma dönemi boyunca tüm işlem düğümlerinizi çalıştırdığınız toplam saat sayısıdır. Veri ambarı kümenizin erişilebilir durumda çalıştığı her saat için faturaya düğüm kullanım saatleri yansıtılır. Veri ambarı kümenizin ücretlendirilmeye devam etmesini istemiyorsanız ek düğüm saatleri karşılığında faturalandırılmamak için kümeyi durdurmanız veya sonlandırmanız gerekir. Tüketilen kısmi düğüm saatleri tam saat olarak faturalandırılır. Faturanıza düğüm başına saatlik 1 birim yansıtıldığından, bir ayın tamamı boyunca aralıksız olarak çalışan 3 düğümlü bir veri ambarı kümesi için 2.160 bulut sunucusu saati faturalandırılır. Baş düğüm saatleri için ücret ödemezsiniz; yalnızca işlem düğümleri ücretlidir.
  • Yedek Depolama Alanı: Yedek depolama alanı, veri ambarınızın otomatik ve manuel anlık yedekleriyle ilişkilendirilmiş depolama alanıdır. Yedek tutma dönemini uzattığınızda veya ek anlık yedekler aldığınızda veri ambarınız tarafından tüketilen yedek depolama alanı artar. Etkin veri ambarı kümesi için tedarik edilen depolama alanınızın %100'ü dolana kadar yedek depolama alanı için ek ücret uygulanmaz. Örneğin 2 TB yerel bulut sunucusu depolama alanına sahip etkin bir Tek Düğüm XL veri ambarı kümeniz varsa ek ücret almadan aylık 2 TB’a kadar yedek depolama alanı sunarız. Tedarik edilen depolama boyutunun üzerindeki yedek depolama alanı ve kümeniz sonlandırıldıktan sonra depolanan yedekler standart Amazon S3 fiyatları üzerinden faturalanır.
  • Veri aktarımı: Aynı Bölge içinde Amazon Redshift ile Amazon S3 arasında aktarılan veriler için veri aktarımı ücretsizdir. Amazon Redshift’e ve dışarı yapılan diğer tüm veri aktarımları, standart AWS veri aktarımı ücretleri üzerinden faturalanır.
  • Taranan veriler: Redshift Spectrum ile sorgunuzun yürütülmesi için taranan Amazon S3 verilerinin miktarına göre ücret ödersiniz. Sorgu çalıştırmadığınızda Redshift Spectrum için ücret ödemezsiniz. Verilerinizi Parquet veya RC gibi sütunlu bir biçimde depolarsanız, Redshift Spectrum satırların tamamını işlemek yerine yalnızca sorgunun ihtiyaç duyduğu sütunları taradığından maliyetleriniz düşer. Benzer şekilde, verileri Redshift Spectrum tarafından desteklenen biçimlerden birini kullanarak sıkıştırırsanız da maliyetleriniz düşer. Veri depolama için standart Amazon S3 ücretlerini, kullanılan küme içinse Amazon Redshift bulut sunucusu ücretlerini ödersiniz.

Aksi belirtilmediği sürece fiyatlarımıza KDV ve ilgili satış vergileri gibi, yürürlükte olan vergiler ve harçlar dahil değildir. Fatura adresi Japonya'da olan müşteriler için AWS hizmetlerinin kullanımı Japonya Tüketim Vergisine tabidir. Daha fazla bilgi edinin.

Amazon Redshift fiyatlandırma bilgileri için lütfen Amazon Redshift fiyatlandırma sayfasını ziyaret edin.

Veri Entegrasyonu ve Yükleme

S: Amazon Redshift veri ambarıma nasıl veri yükleyebilirim?

Amazon Redshift’e Amazon S3, Amazon DynamoDB, Amazon EMR, AWS Glue, AWS Data Pipeline gibi çeşitli veri kaynaklarından veya Amazon EC2’deki ya da şirket içindeki başka herhangi bir SSH özellikli konaktan veri yükleyebilirsiniz. Amazon Redshift, veri ambarı kümenize veri alma hızını en üst düzeye çıkarabilmeniz için verilerinizi paralel olarak her işlem düğümüne yüklemeye çalışır. Verileri Amazon Redshift’e yükleme konusunda daha ayrıntılı bilgi edinmek için lütfen Kullanmaya Başlama Kılavuzumuza bakın.

Evet, istemciler ODBC veya JDBC kullanarak Amazon Redshift’e bağlanabilir ve 'insert' SQL komutları çalıştırarak veri ekleyebilir. S3 veya DynamoDB tarafından yöntemler her işlem düğümüne paralel olarak yüklenirken SQL ekleme bildirimlerinin tek bir baş düğüm aracılığıyla yüklenmesi nedeniyle bunun daha yavaş olduğunu lütfen unutmayın.

S: Mevcut Amazon RDS, Amazon EMR, Amazon DynamoDB ve Amazon EC2 veri kaynaklarımdan Amazon Redshift’e nasıl veri yükleyebilirim?

COPY komutumuzu kullanarak Amazon EMR, Amazon DynamoDB veya SSH özellikli herhangi bir konaktan doğrudan Amazon Redshift’e paralel olarak veri yükleyebilirsiniz. Redshift Spectrum, basit bir INSERT INTO komutuyla Amazon S3’ten kümenize veri yüklemenize de olanak tanır. Bu sayede, kümenize Parquet ve RC gibi farklı biçimlerden veri yükleyebilirsiniz. Bu yaklaşımı kullanmanız durumunda Amazon S3’ten taranan veriler için Redshift Spectrum ücretleri uygulanacağını unutmayın.

Ayrıca, birçok ETL şirketi, sunduğu araçlarla kullanım konusunda Amazon Redshift’e sertifika vermiştir ve bunların bazıları, verilerinizi yüklemeye başlamanıza yardımcı olmak için ücretsiz deneme sunar. AWS Data Pipeline, çeşitli AWS veri kaynaklarından veri yüklemeye yönelik yüksek performanslı, güvenilir, hata toleranslı bir çözüm sağlar. AWS Data Pipeline’ı kullanarak veri kaynağını, istenen veri dönüşümlerini belirtebilir, sonra da önceden yazılmış bir içeri aktarma betiğini kullanarak verilerinizi Amazon Redshift’e yükleyebilirsiniz. Ayrıca, AWS Glue, müşterilerin verilerini analitik için hazırlamalarını ve yüklemelerini kolaylaştıran, tam olarak yönetilen bir ayıklama, dönüştürme ve yükleme hizmetidir. AWS Management Console’da birkaç tıklama ile AWS Glue ETL işleri oluşturup bunları çalıştırabilirsiniz.

S: Başlangıçta Amazon Redshift’e yüklenmesi gereken çok verim var. İnternet üzerinden aktarmam uzun sürer. Bu verileri nasıl yükleyebilirim?

AWS Import/Export’u kullanarak taşınabilir depolama araçları üzerinden Amazon S3’e veri aktarabilirsiniz. Ayrıca, AWS Direct Connect’i kullanarak ağınız ya da veri merkeziniz ile AWS arasında özel bir ağ bağlantısı kurabilirsiniz. Verilerinizi aktarmak için 1 Gbit/sn veya 10 Gbit/sn bağlantı noktalarından birini seçebilirsiniz.

Güvenlik

S: Amazon Redshift, veri kaynağımı nasıl güvenli tutar?

Amazon Redshift, endüstri standardı şifreleme tekniklerini kullanarak verilerinizi şifreler ve hem aktarım hem bekleme sırasında güvenli tutar. Amazon Redshift, aktarım sırasında verilerin güvenli tutulması için istemci uygulamanızla Redshift veri ambarı kümeniz arasında SSL özellikli bağlantıları destekler. Verilerinizin beklerken güvenli tutulması için Amazon Redshift tarafından veriler diske yazılırken donanım hızlandırmalı AES-256 kullanılarak her bir blok şifrelenir. Bu işlemler, ara sorgu sonuçları dahil olmak üzere diske yazılan her şeyi şifreleyen G/Ç alt sisteminin düşük bir düzeyinde gerçekleşir. Bloklar olduğu gibi yedeklendiğinden, yedekler de şifreli olur. Amazon Redshift varsayılan olarak anahtar yönetimini üstlenir ancak anahtarlarınızı kendi donanım güvenlik modülleriniz (HSM) ya da AWS Key Management Service aracılığıyla yönetmeyi tercih edebilirsiniz.

Redshift Spectrum, kendi hesabınızın AWS Key Management Service (KMS) tarafından yönetilen varsayılan anahtarını kullanarak Amazon S3’ün Sunucu Tarafı Şifreleme (SSE) özelliğini destekler.

S: Amazon Redshift’i Amazon Virtual Private Cloud’da (Amazon VPC) kullanabilir miyim?

Evet, Amazon Redshift’i VPC yapılandırmanızın bir parçası olarak kullanabilirsiniz. Amazon VPC ile kendi veri merkezinizde çalıştırabileceğiniz geleneksel bir ağa çok benzeyen bir sanal ağ topolojisi tanımlayabilirsiniz. Bu sayede Amazon Redshift veri ambarı kümenize kimlerin erişebileceği konusunda tam denetime sahip olursunuz.

Redshift Spectrum’u VPC’nizin parçası olan bir Amazon Redshift kümesi ile kullanabilirsiniz. Redshift Spectrum’un şu an Enhanced VPC Routing özelliğini desteklemediğini unutmayın.

S: Amazon Redshift işlem düğümlerime doğrudan erişebilir miyim?

Hayır. Amazon Redshift işlem düğümleriniz özel bir ağ alanındadır ve bunlara yalnızca veri ambarı kümenizin baş düğümünden erişilebilir. Bu mekanizma, verileriniz için ek bir güvenlik katmanı sağlar.

Erişilebilirlik ve Dayanıklılık

S: Bir düğümümdeki sürücülerden biri başarısız olursa veri ambarı kümemin erişilebilirliği ve veri dayanıklılığı bundan nasıl etkilenir?

Bir sürücünün başarısız olması durumunda Amazon Redshift veri ambarı kümeniz erişilebilir kalır, ancak belirli sorgular için küçük bir performans düşüşü yaşayabilirsiniz. Bir sürünün başarısız olması durumunda Amazon Redshift, ilgili sürücüdeki verilerin düğüm içindeki diğer sürücülerde depolanan bir replikasını şeffaf bir şekilde kullanır. Amazon Redshift ayrıca verilerinizi iyi durumdaki bir sürücüye taşımaya çalışır veya bunu yapamıyorsa düğümünüzü değiştirir. Tek düğümlü kümeler veri replikasyonunu desteklemez. Bir sürücünün başarısız olması durumunda kümeyi S3’teki anlık yedekten geri yüklemeniz gerekir. Üretim için en az iki düğüm kullanılmasını öneririz.

S: Tek bir düğüm başarısız olursa veri ambarı kümemin erişilebilirliği ve veri dayanıklılığı bundan nasıl etkilenir?

Amazon Redshift, veri ambarı kümenizde başarısız olan düğümü otomatik olarak algılayıp değiştirir. Yedek bir düğüm tedarik edilip veritabanına eklenene kadar veri ambarı kümesi sorgulara ve güncelleştirmelere kapalı olur. Amazon Redshift, yedek düğümünüzü anında erişilebilir hale getirir ve verilerinizi olabildiğince hızlı bir şekilde sorgulamaya başlayabilmeniz için S3’ten önce en sık erişilen verileri yükler. Tek düğümlü kümeler veri replikasyonunu desteklemez. Bir sürücünün başarısız olması durumunda kümeyi S3’teki anlık yedekten geri yüklemeniz gerekir. Üretim için en az iki düğüm kullanılmasını öneririz.

S: Veri ambarı kümemin Erişilebilirlik Alanı’nda (AZ) bir kesinti yaşanırsa veri ambarı kümemin erişilebilirliği ve veri dayanıklılığı bundan nasıl etkilenir?

Amazon Redshift veri ambarı kümenizin Erişilebilirlik Alanı erişilemez hale gelirse AZ’de güç ve ağ erişimi yeniden sağlanana kadar kümenizi kullanamazsınız. AZ yeniden erişilebilir hale geldiğinde Amazon Redshift veri ambarınızı hemen kullanmaya başlayabilmeniz için veri ambarı kümenizin verileri korunur. Ayrıca, anlık yedekleriniz varsa bunları aynı bölgedeki yeni bir AZ’ye geri yüklemeyi de tercih edebilirsiniz. Amazon Redshift, olabildiğince hızlı bir şekilde sorgu gerçekleştirmeye devam edebilmeniz için önce en sık erişilen verilerinizi geri yükler.

S: Amazon Redshift, Multi-AZ Dağıtımları destekler mi?

Amazon Redshift şu an yalnızca Single-AZ dağıtımları destekler. Aynı Amazon S3 giriş dosyalarından ayrı AZ’lerdeki iki Amazon Redshift veri ambarı kümesine veri yükleyerek birden çok AZ'de veri ambarı kümesi çalıştırabilirsiniz. Redshift Spectrum ile farklı AZ’lerde birden çok küme başlatabilir ve Amazon S3’teki verileri kümenize yüklemenize gerek kalmadan bunlara erişebilirsiniz. Ayrıca, bir veri ambarı kümesini veri ambarı kümesini, anlık yedeklerinizden farklı bir AZ’ye yükleyebilirsiniz.

Yedekleme ve Geri Yükleme

S: Amazon Redshift, verilerimi nasıl yedekler? Kümemi bir yedekten nasıl geri yükleyebilirim?

Amazon Redshift, yüklendiğinde veri ambarı kümenizdeki tüm verileri çoğaltmasının yanı sıra sürekli olarak S3’te yedekler. Amazon Redshift, her zaman verilerinizin en az üç kopyasını (işlem düğümlerinde özgün kopya ve replika, Amazon S3’te bir yedek) tutmaya çalışır. Redshift olağanüstü durum kurtarma için anlık yedeklerinizi zaman uyumsuz olarak bir başka bölgedeki S3'e de çoğaltabilir.

Amazon Redshift varsayılan olarak veri ambarı kümeniz için 1 günlük bir tutma dönemiyle otomatik yedeklemeyi etkinleştirir. Bu süre 35 güne kadar uzayacak şekilde yapılandırılabilir.

Ücretsiz yedek depolama alanı, veri ambarı kümesindeki düğümlerin toplam depolama boyutuyla sınırlıdır ve yalnızca etkin veri ambarı kümeleri için geçerlidir. Örneğin, toplam 8 TB veri ambarı depolama alanınız varsa ücretsiz olarak en fazla 8 TB yedek depolama alanı sağlarız. Yedeklerinizin tutulma süresini bir günden uzun yapmak istiyorsanız AWS Management Console’u ya da Amazon Redshift API’lerini kullanarak bunu yapabilirsiniz. Otomatik anlık yedekler hakkında daha fazla bilgi edinmek için lütfen Amazon Redshift Yönetim Kılavuzu'na başvurun. Amazon Redshift yalnızca değişen verileri yedeklediğinden, çoğu anlık yedek ücretsiz depolama alanınızın küçük bir miktarını kullanır.

Bir yedeği geri yüklemeniz gerektiğinde, yedek tutma aralığınız içinde tüm otomatik yedeklere erişebilirsiniz. Geri yüklenecek yedeği seçtiğinizde, yeni bir veri ambarı kümesi tedarik eder ve verilerinizi buna geri yükleriz.

S: Otomatik yedeklerimin ve anlık yedeklerimin tutulduğu süreyi nasıl yönetirim?

Otomatik yedeklerinizin tutulduğu süreyi AWS Management Console veya ModifyCluster API'si ile RetentionPeriod parametresini değiştirerek yönetebilirsiniz. Otomatik yedeklemeyi tamamen kapatmak istiyorsanız tutma dönemini 0 değerine ayarlayarak (önerilmez) bunu yapabilirsiniz.

S: Veri ambarı kümemi silersem yedeklerime ne olur?

Bir veri ambarı kümesini sildiğinizde, silme işleminin üzerine son bir anlık yedeğin nerede oluşturulacağını belirtme olanağınız vardır. Bu sayede, silinen bir veri ambarı kümesi daha sonra geri yüklenebilir. Veri ambarı kümenizin daha önce manuel olarak oluşturulmuş tüm anlık yedekleri korunur ve bunları silmediğiniz sürece standart Amazon S3 fiyatları üzerinden faturalandırma devam eder.

Ölçeklenebilirlik

S: Amazon Redshift veri ambarı kümemin boyutunu ve performansını nasıl ölçeklendirebilirim?

Sorgu performansını artırmak veya fazla CPU, bellek ya da G/Ç kullanımına yanıt vermek istiyorsanız AWS Management Console veya ModifyCluster API’si aracılığıyla veri ambarı kümenizdeki düğümlerin sayısını artırabilirsiniz. Veri ambarı kümenizi değiştirdiğinizde istediğiniz değişiklikler anında uygulanır. Amazon Redshift veri ambarı kümenize yönelik işlem kullanımı, depolama kullanımı ve okuma/yazma trafiğine ilişkin ölçümlere AWS Management Console veya Amazon CloudWatch API’leri aracılığıyla ücretsiz olarak erişebilirsiniz. Amazon Cloudwatch özel ölçüm işlevi aracılığıyla, kullanıcı tarafından tanımlanmış başka ölçümler ekleyebilirsiniz.

Redshift Spectrum ile Amazon S3’te depolanan aynı verilere erişen birden çok Amazon Redshift kümesi çalıştırabilirsiniz. Farklı kullanım örnekleri için farklı kümeler kullanabilirsiniz. Örneğin, bir kümeyi standart raporlama için kullanırken başka bir kümeyi veri bilimi sorguları için kullanabilirsiniz. Pazarlama ekibiniz, operasyon ekibinizin kümelerinden farklı olarak kendi kümelerini kullanabilir. Redshift Spectrum, Amazon S3’ten alınan verileri okumak ve işlemek için yerel kümenizdeki düğümlerin türünün ve sayısının yanı sıra sorgunuz için işlenmesi gereken dosya sayısına göre, sorgunuzun yürütülmesini otomatik olarak bir ortak kaynak havuzundaki birkaç Redshift Spectrum çalışanına dağıtır ve geriye kalan işlemler için sonuçları yeniden Amazon Redshift kümenize çeker.

S: Ölçeklendirme sırasında veri ambarı kümem erişilebilir kalır mı?

Ölçeklendirme işlemleri sırasında yeni bir veri ambarı kümesi oluşturulurken mevcut veri ambarı kümesi okuma işlemlerine açık kalır. Yeni veri ambarı kümesi hazır olduğunda, mevcut veri ambarı veri kümesinin kurallı ad kaydı yeni veri ambarı kümesini gösterecek şekilde değiştirildiği sırada mevcut veri ambarı kümeniz geçici olarak erişim dışı kalır. Bu erişim dışı kalma dönemi genellikle yalnızca birkaç dakika sürer ve değişikliğin hemen uygulanması gerektiğini belirtmediğiniz sürece veri ambarı kümenizin bakım aralığı içinde kalır. Amazon Redshift, verileri mevcut veri ambarı kümenizdeki işlem düğümlerinden yeni kümenizdeki işlem düğümüne paralel olarak taşır. Bu sayede işleminiz en kısa sürede tamamlanır.

Eş Zamanlılık

S: Redshift kümemin eş zamanlılığın yüksek olduğu anlarda bile tutarlı bir şekilde hızlı performans sunacağından emin olmak için kaynaklarımı nasıl yönetmeliyim?

Normal bir veri ambarında eş zamanlı olarak kullanılan sorgu miktarı gün içinde büyük ölçüde değişiklik gösterir. En yüksek talebe göre kaynak sağlamaktansa, yalnızca gerekli aralıklar için kaynak eklemek daha uygun maliyetlidir. Amazon RedShift, bunu sizin için otomatik olarak halleder. 

Eş zamanlı ölçeklendirme, binlerce eş zamanlı sorgu söz konusu olduğunda dahi tutarlı olarak hızlı sorgu performansı sunan bir Amazon Redshift özelliğidir. Bu özellik sayesinde Amazon Redshift, gerektiğinde yoğun talebi karşılamak üzere otomatik olarak geçici kapasite ekler. Amazon Redshift otomatik olarak sorguları ölçeklendirme kümelerine yönlendirir. Bu kümeler saniyeler içinde sağlanır ve anında sorguları işlemeye başlar.

Bu özellik çoğu müşteriye ücretsiz olarak sunulur. Tüm Amazon Redshift kümeleri, günde bir saate kadar ücretsiz eş zamanlı ölçeklendirme kredisi kazanır. Bu sayede, analiz talebinin dalgalandığı dönemlerde bile aylık masraflarınızı öngörebilirsiniz.

S: Esnek Yeniden Boyutlandırma nedir ve Eş Zamanlı Ölçeklendirme ile arasında ne fark vardır?

Esnek Yeniden Boyutlandırma, tek bir Redshift kümesindeki düğümleri dakikalar içinde ekleyerek veya kaldırarak sorgu performansını yönetir. Örneğin, günün belirli saatlerine veya ay sonu raporlamasına yönelik bir ETL iş yükünün zamanında tamamlanabilmesi için ek Redshift kaynakları gerekebilir. Eş Zamanlı Ölçeklendirme, daha fazla küme kaynağı ekleyerek genel sorgu eş zamanlılığını artırır.

S: Eş Zamanlı Ölçeklendirme kümelerine doğrudan erişebilir miyim?

Hayır. Eş Zamanlı Ölçeklendirme, Redshift kaynaklarından oluşan ve çok büyük oranda ölçeklendirilebilen bir havuzdur. Müşteriler buna doğrudan erişemez.

Sorgulama ve Analiz

S: Amazon Redshift ve Redshift Spectrum, tercih ettiğim iş zekası yazılım paketi ve ETL araçlarıyla uyumlu mudur?

Endüstri standardı SQL kullanan Amazon Redshift’e standart JDBC ve ODBC sürücüleri kullanılarak erişilir. Amazon Redshift özel JDBC ve ODBC sürücülerini Redshift Console’un Connect Client (İstemci Bağlama) sekmesinden indirebilirsiniz. Popüler BI ve ETL satıcılarıyla olan entegrasyonumuzu doğruladık ve bunların bazıları, verilerinizi yükleyip analiz etmeye başlamanıza yardımcı olmak için ücretsiz denemeler sunuyor. Dilerseniz AWS Marketplace’e giderek Amazon Redshift ile çalışacak şekilde tasarlanmış çözümleri dakikalar içinde dağıtıp yapılandırabilirsiniz.

Redshift Spectrum, tüm Amazon Redshift istemci araçlarını destekler. İstemci araçları OBDC ve JDBC bağlantıları kullanarak Amazon Redshift kümesinin uç noktasına bağlanmaya devam edebilir. Değişiklik gerekmez.

Tam olarak aynı söz dizimini kullanırsınız ve Redshift Spectrum’daki tablolara erişim için Redshift kümenizin yerel depolama alanındaki tablolarla aynı sorgulama özelliklerine sahip olursunuz. Harici tablolara, bunlar kaydedilirken kullanılan CREATE EXTERNAL SCHEMA komutunda tanımlanan şema adı kullanılarak başvurulur.

S: Redshift Spectrum hangi veri ve sıkıştırma biçimlerini destekler?

Redshift Spectrum şu anda Avro, CSV, Grok, Ion, JSON, ORC, Parquet, RCFile, RegexSerDe, SequenceFile, TextFile ve TSV dahil olmak üzere birçok açık kaynak veri biçimini destekler.

Redshift Spectrum şu an Gzip ve Snappy sıkıştırmayı destekler.

S: Yerel depolama alanımdaki bir tablo, harici bir tabloyla aynı ada sahipse ne olur?

Yerel tablolarda olduğu gibi, sorgunuzda şema adını şema_adı.tablo_adı biçiminde kullanarak tam olarak hangisini kast ettiğinizi seçebilirsiniz.

S: S3 data lake’imle ilgili meta verileri depolamak için bir Hive Metastore kullanıyorum. Redshift Spectrum’u kullanabilir miyim?

Evet. CREATE EXTERNAL SCHEMA komutu Hive Metastore’ları destekler. Şu anda Hive Metastore’a yönelik DDL desteği sunmuyoruz.

S: Kümemde oluşturulan tüm harici veritabanı tablolarının listesine nasıl ulaşabilirim?

Bu bilgiyi edinmek için SVV_EXTERNAL_TABLES adlı sistem tablosunu sorgulayabilirsiniz.

İzleme

S: Amazon Redshift veri ambarı kümemin performansını nasıl izleyebilirim?

Amazon Redshift veri ambarı kümenize yönelik işlem kullanımı, depolama kullanımı ve okuma/yazma trafiğine ilişkin ölçümlere AWS Management Console veya Amazon CloudWatch API’leri aracılığıyla ücretsiz olarak erişebilirsiniz. Amazon Cloudwatch’un özel ölçüm işlevi aracılığıyla, kullanıcı tarafından tanımlanmış başka ölçümler ekleyebilirsiniz. Amazon Redshift, CloudWatch ölçümlerine ek olarak AWS Management Console aracılığıyla da sorgu ve küme performansıyla ilgili bilgi sağlar. Bu bilgiler, en çok sistem kaynağını hangi kullanıcıların ve sorguların tükettiğini görerek performans sorunlarını tanılamanıza olanak tanır. Ayrıca, verilerinizin ve sorgularınızın tüm düğümlere dengeli bir şekilde dağıldığından emin olmak için işlem düğümlerinizin her birindeki kaynak kullanımını görebilirsiniz.

S: Kümemdeki verilere erişen bazı sorguların Redshift Spectrum sorgularımdan daha yavaş çalıştığını fark ettim. Bu neden oluyor?

Amazon Redshift sorguları, küme kaynaklarınızda yerel diske yönelik olarak çalıştırılır. Redshift Spectrum sorguları, sorgu başına ölçek genişletme kaynakları kullanılarak S3’e yönelik olarak çalıştırılır. Çoğu sorgu için yerel disk daha hızlı olsa da çok veri tarayan ve sade işlemler gerçekleştiren sorgulara çok sayıda Redshift Spectrum çalışanı uygulayıp bunları hızla tamamlayabiliriz.

Bakım

S: Bakım aralığı nedir? S: Yazılım bakımı sırasında veri ambarı kümeme erişilebilir mi?

Amazon Redshift, düzenli aralıklarla bakım gerçekleştirerek düzeltmeleri, geliştirmeleri ve yeni özellikleri kümenize uygular. Kümeyi programlama yoluyla ya da Redshift Console’u ile değiştirerek zamanlanan bakım aralıklarını değişltirebilirsiniz. Bu bakım aralıkları sırasında Amazon Redshift kümeniz normal işlemlere kapalı olur. Bakım aralıkları ve bölgeye göre zamanlamalar hakkında daha fazla bilgi edinmek için Amazon Redshift Yönetim Kılavuzu’nun Bakım Aralıkları bölümüne bakın.

Amazon Redshift fiyatlandırması hakkında daha fazla bilgi edinin

Fiyatlandırma sayfasını ziyaret edin
Oluşturmaya hazır mısınız?
Amazon Redshift'i kullanmaya başlayın
Başka sorunuz mu var?
Bize ulaşın