Amazon Redshift Hakkında SSS

Genel

On binlerce müşteri, bulutta SQL analizleri yapmak için her gün Amazon Redshift’i kullanıyor ve iş öngörüleri için çok sayıda eksabayt boyutundaki veriyi işliyor. Artan verilerinizin operasyonel veri depoları, veri gölleri, akış verisi hizmetleri veya üçüncü taraf veri kümelerinde depolanmasına bakılmaksızın Amazon Redshift, minimum hareket veya kopyalamayla güvenli bir şekilde verilere erişmenize ve verileri birleştirip paylaşmanıza yardımcı olur. Amazon Redshift, sıfır ETL yaklaşımlarını kullanmak veya neredeyse gerçek zamanlı analizler için verilere yerinde erişmenize, SQL’de makine öğrenimi modelleri oluşturmanıza ve Redshift’te verileri kullanarak Apache Spark analizlerini etkinleştirmenize yardımcı olmak için AWS veri tabanı, analizleri ve makine öğrenimi hizmetleri ile temelden entegredir. Amazon Redshift Sunucusuz; mühendisleriniz, geliştiricileriniz, veri bilimcileriniz ve analistlerinizin yönetim işlemi gerektirmeyen bir ortamda kolayca kullanmaya başlamalarına ve analizleri hızla ölçeklendirmelerine olanak sağlar. Verimli ölçeklendirme için bilgi işlem ve depolamayı ayıran Yüksek Hacimli Paralel İşleme (MPP) altyapısı ve mimarisi ile makine öğrenimi temelli performans inovasyonlarına (ör. AutoMaterialized Views) sahip Amazon Redshift, ölçek için oluşturulmuştur ve diğer bulut veri ambarlarına kıyasla 5 kata kadar daha iyi fiyat performansı sunar.

Binlerce müşteri, öngörülere ulaşma sürelerini hızlandırmak amacıyla Amazon Redshift’i veri tabanı ve makine öğrenimi hizmetleri ile iyi entegre olan, kullanımı kolay ve tüm analiz ihtiyaçlarını karşılayan bir merkezî hizmet olabilen güçlü bir analitik hizmeti olduğu için seçiyor. Amazon Redshift Sunucusuz, veri ambarı kapasitesini otomatik olarak tedarik edip ölçeklendirerek zorlu ve öngörülemez iş yükleri için yüksek performans üretir. Amazon Redshift; pano oluşturma, uygulama geliştirme, veri paylaşma, ETL (Ayıklama, Dönüştürme, Yükleme) işleri gibi çeşitli analitik iş yükleri için lider fiyat performansı sunar. Amazon Redshift, terabayttan petabayta kadar büyüklükteki veriler üzerinde analiz çalıştıran on binlerce müşteriyle, filo performansı telemetrisine dayalı olarak gerçek dünyadaki müşteri iş yükü performansını optimize eder ve maliyetleri düşük tutarken iş yüküne göre doğrusal olarak ölçeklenen performans sunar. Performans inovasyonları ek bir maliyet olmadan müşterilere sunulur. Amazon Redshift; operasyonel veri tabanlarınız, veri gölünüz, veri ambarınız, akış verileri ve üçüncü taraf veri kümeleri genelindeki tüm verileriniz ile ilgili gerçek zamanlı ve tahmine dayalı analizler çalıştırarak öngörüler elde etmenize olanak tanır. Amazon Redshift; tek oturum açma (SSO) için yerleşik kimlik yönetimi ve federasyonu, çok faktörlü kimlik doğrulama, sütun düzeyinde erişim kontrolü, kayıt seviyesinde güvenlik, rol tabanlı erişim kontrolü, Amazon Sanal Özel Bulut (Amazon VPC) ve daha hızlı küme yeniden boyutlandırması ile sektör lideri güvenliği destekler.

Amazon Redshift, AWS tarafından tam olarak yönetildiği için donanım tedarik etme, yazılım düzeltme eki uygulama, kurulum, yapılandırma, düğüm ve sürücüleri izleyerek hatalardan kurtarma veya yedekleme gibi veri ambarı yönetimi görevleri ile ilgili olarak artık endişelenmenize gerek yoktur. AWS, bir veri ambarını kurmak, işletmek ve ölçeklendirmek için gereken işleri sizin adınıza yöneterek zaman tasarrufu yapmanızı ve uygulamalarınızı geliştirmeye odaklanmanızı sağlar. Amazon Redshift Sunucusuz, veri ambarı kapasitesini otomatik olarak tedarik edip ölçeklendirerek zorlu ve öngörülemez iş yükleri için yüksek performans üretir ve siz sadece kullandığınız kaynaklar karşılığında ücret ödersiniz. Otomatik iyileştirme özellikleri de bulunan Amazon Redshift, bunun yanı sıra Redshift Advisor’da ambarınızın yönetimine ilişkin önerilerde bulunur. Amazon Redshift, Redshift Spectrum ile bilgi işlem altyapısı, yük dengeleme, planlama ve zamanlamanın yanı sıra Amazon S3’te depolanan verilere yönelik sorgularınızı yürütme süreçlerinin tümünü yönetir. Amazon Redshift; Amazon RDS ve Amazon S3 veri gölünüz gibi operasyonel veri tabanlarından verilere yerinde erişmek için Amazon Redshift’e Amazon Aurora Sıfır ETL ile federe sorgulama gibi özelliklerle veri tabanı hizmetlerine derinlikli entegrasyonla tüm verileriniz üzerinde analiz sağlar. Redshift, akış verilerini veya Amazon S3 dosyalarını otomatik olarak alan kodsuz, otomatikleştirilmiş veri iletişim hatlarıyla kolaylaştırılmış veri alımı sağlar. Redshift ayrıca, AWS Veri Değişimi ile entegredir ve kullanıcıların üçüncü taraf veri kümelerini bulmasına, sorgulamasına, bunlara abone olmasına ve kapsamlı öngörüler için verileriyle birleştirmesine olanak tanır. Amazon SageMaker’a yerel entegrasyon sayesinde müşteriler, doğrudan veri ambarlarında kalabilir ve SQL’de makine öğrenimi modelleri oluşturabilir, eğitebilir ve geliştirebilirler. Amazon Redshift, diğer bulut veri ambarlarına kıyasla 5 kata kadar daha iyi fiyat performansı ile tüm SQL analitik ihtiyaçlarınızı karşılar.

Tam olarak yönetilen bir hizmet olan Amazon Redshift, sunduğu tedarik edilen ve sunucusuz seçenekleriyle veri ambarınızı yönetmek zorunda kalmadan analiz çalıştırma ve ölçeklendirmeyi sizin adınıza daha kolay verimli hâle getirir. Veri ambarını saniyeler içinde otomatik olarak tedarik etmek için yeni bir Amazon Redshift Sunucusuz uç nokta başlatabilir veya tahmin edilebilir iş yükleri için tedarik edilen seçeneği tercih edebilirsiniz.

AWS Yönetim Konsolu’nda birkaç adımda veri sorgulamaya başlayabilirsiniz. TPC-H, TPC-DS karşılaştırmalı değerlendirme veri kümelerini içeren önceden yüklenmiş örnek veri kümelerinden ve diğer örnek sorgulardan faydalanarak analizleri hemen başlatabilirsiniz. Amazon Redshift Sunucusuz’u kullanmaya başlamak için “Try Amazon Redshift Serverless” (Amazon Redshift Sunucusuz’u Dene) ögesini seçin ve veri sorgulamaya başlayın. Kullanmaya buradan başlayın.

TPC-DS karşılaştırmalı değerlendirme sonuçlarına göre Amazon Redshift, kullanılmaya başlandığı andan itibaren nispeten küçük 3 TB’lık bir veri kümesi için bile en iyi fiyat performansını sunar. Amazon Redshift, diğer bulut veri ambarlarına kıyasla 5 kata kadar daha iyi fiyat performansı sunar. Bu, Amazon Redshift’in lider fiyat performansından manuel ayar yapmak zorunda kalmadan başlangıçtan itibaren fayda sağlayabileceğiniz anlamına gelir. Filo performansı telemetrisine dayalı olarak, çoğu iş yüklerinin kısa sorgu iş yükleri (1 saniyeden daha az kısa sürede çalışan iş yükleri) olduğunu biliyoruz. Bu iş yükleri için en son karşılaştırmalar, Amazon Redshift’in yüksek eş zamanlılık, düşük gecikme süreli iş yüklerinde diğer bulut veri ambarlarına kıyasla 7 kata kadar daha iyi fiyat performansı sunduğunu göstermektedir. Buradan daha fazla bilgi edinebilirsiniz.

Evet, Amazon Redshift uzmanları sorularınızı yanıtlamak ve destek sunmak için hazırdır. Bize ulaşın, AWS’nin kuruluşunuza nasıl destek olabileceğini görüşmek için size bir iş günü içinde dönüş yaparız.

Amazon Redshift tarafından yönetilen depolama, sunucusuz ve RA3 düğüm tipleriyle kullanılabilir ve kümeyi yalnızca işlem gereksinimlerinize göre boyutlandırmak üzere işlem ve depolama alanı için bağımsız olarak ölçeklendirmenize ve ödeme yapmanıza olanak tanır. Amazon Redshift, 1. katman önbellek olarak otomatik şekilde yüksek performanslı SSD tabanlı yerel depolamayı kullanır ve herhangi bir işlem yapmadan otomatik olarak Amazon S3'e ölçeklendirirken yüksek performans sağlamak için veri bloğu sıcaklığı, veri bloğu yaşı ve iş yükü düzenleri gibi optimizasyonlardan yararlanır.

Amazon Redshift Yoğun Depolama veya Yoğun İşlem düğümlerini zaten kullanıyorsanız Esnek Yeniden Boyutlandırma'yı kullanarak mevcut kümelerinizi yeni işlem bulut sunucusu RA3'e yükseltebilirsiniz. RA3 bulut sunucusunu kullanan Amazon Redshift Sunucusuz ve kümeler, Redshift tarafından yönetilen depolamayı otomatik olarak kullanarak veri depolar. Bu özelliği kullanabilmek için Amazon Redshift Sunucusuz veya RA3 bulut sunucularını kullanmanın dışında başka bir eylem gerekmez.

Amazon Redshift Spectrum, Amazon Redshift’in Amazon S3’teki veri gölünüzde veri yükleme veya ETL gereksinimi olmadan sorgu çalıştırmanıza olanak tanıyan bir özelliğidir. Bir SQL sorgusu gönderdiğinizde, bir sorgu planı oluşturup bunu iyileştiren Amazon Redshift uç noktasına gider. Amazon Redshift, yerel ortamda ve Amazon S3’te bulunan verileri belirler, okunması gereken S3 verilerini en düşük miktara indirmek üzere bir plan oluşturur ve Amazon Redshift Spectrum çalışanlarının paylaşılan bir kaynak havuzu üzerinden Amazon S3’teki verileri okuyup işlemelerini talep eder.

Aşağıdaki durumlarda RA3 düğüm türlerini kullanmayı göz önünde bulundurun:

  • İşlem için depolamadan ayrı olarak ölçeklendirme ve ödeme yapma esnekliğine sahip olmanız gerektiğinde.
  • Toplam verilerinizin bir bölümünü sorguladığınızda.
  • Veri hacminiz hızla arttığında veya hızla artması beklendiğinde.
  • Kümeyi sadece performans ihtiyaçlarınıza göre boyutlandırma esnekliğine sahip olmak istediğinizde.

Verilerin ölçeği büyümeye devam edip petabaytlara ulaştığında Amazon Redshift veri ambarınıza aldığınız veri miktarı da büyür. Verilerinizin tümünü uygun maliyetli bir biçimde analiz etmenin yollarını aramaya başlayabilirsiniz.

Yönetilen depolamaya sahip yeni Amazon Redshift RA3 bulut sunucuları sayesinde düğüm sayısını performans gereksinimlerinize göre seçebilir ve yalnızca kullandığınız yönetilen depolama için ödeme yaparsınız. Bu, size RA3 kümenizi depolama maliyetlerinizi artırmadan günlük olarak işlediğiniz veri miktarına göre boyutlandırma esnekliği sunar. AWS Nitro Sistemi üzerinde geliştirilen yönetilen depolamaya sahip RA3 bulut sunucuları, sık erişilen verileriniz için yüksek performanslı SSD’leri ve nadir erişilen verileriniz için Amazon S3’ü kullanarak kullanım kolaylığı, uygun maliyetli depolama ve hızlı sorgu performansı sağlar.

Amazon Redshift uzamsal, verilerinizle ilgili kapsamlı öngörüler için konum tabanlı analizler sağlar. Uzamsal veriler ile iş verilerini sorunsuz bir biçimde entegre ederek karar verme süreçlerini destekleyen analizler sunar. Amazon Redshift, polimorfik veri türü GEOMETRİSİNE ve çeşitli önemli SQL uzamsal fonksiyonlarına sahip yerel uzamsal veri işleme desteğini 2019'un Kasım ayında kullanıma sundu. Artık COĞRAFYA veri türünü destekliyoruz ve SQL uzamsal fonksiyonlar kitaplığımızın büyüklüğü 80’e ulaştı. Shapefiles, GeoJSON, WKT, WKB, eWKT ve eWKB dâhil olmak üzere yaygın uzamsal veri türleri ve standartlarının tümünü destekliyoruz. Daha fazla bilgi edinmek için belgeler veya Amazon Redshift uzamsal öğreticisi sayfasını ziyaret edin.

Hem Amazon Athena hem de Amazon Redshift Sunucusuz, sunucusuz olsa ve SQL kullanıcılarını etkinleştirse de farklı gereksinimlere ve kullanım örneklerine yöneliktir.

Depolama ile bilgi işlem ve makine öğrenimi liderliğindeki otomatik optimizasyon özelliklerini ayıran Yüksek Hacimli Paralel İşleme (MPP) mimarisiyle, Amazon Redshift gibi sunucusuz veya tedarik edilmiş bir veri ambarı, karmaşık BI ve analiz iş yükleri için her ölçekte en iyi fiyat performansına ihtiyaç duyan müşteriler için mükemmel bir seçimdir. Müşteriler, sıfır ETL ve kodsuz yöntemlerle yüksek performanslı analitik için verilere yerinde erişmek veya verileri kolayca almak ya da ambara taşımak için kullanılabilen derinlikli entegrasyonlarla birlikte Amazon Redshift’i veri mimarilerinin merkezî bileşeni olarak kullanabilirler. Müşteriler, AWS Veri Değişimi ile entegrasyon yoluyla Amazon S3, Aurora ve Amazon RDS gibi operasyonel veri tabanları, üçüncü taraf veri ambarlarında depolanan verilere erişebilir ve analitik için Amazon Redshift veri ambarında depolanan verilerle birleştirebilir. Veri ambarını kolayca başlatabilir ve tüm bu verilerin üzerinde makine öğrenimi gerçekleştirebilirler.

Amazon Athena, verileri alma veya işleme derdi olmadan genişletilebilir bir bağlayıcı çerçevesi (uygulamalar ve şirket içi veya diğer bulut analizi sistemleri için 30’un üzerinde bağlayıcı içerir) aracılığıyla veri gölünüzdeki veya herhangi bir veri kaynağındaki verilerin etkileşimli analizleri ve veri keşfi için çok uygundur. Spark, Presto ve Apache Iceberg gibi açık kaynaklı altyapılar ve çerçeveler üzerine kurulu Amazon Athena, müşterilere Python veya SQL kullanma veya açık veri biçimleri üzerinde çalışma esnekliği sunar. Müşteriler, açık kaynak çerçeveleri ve veri biçimlerini kullanarak etkileşimli analiz gerçekleştirmek istiyorsa Amazon Athena harika bir başlangıç noktasıdır.

Sunucusuz

Amazon Redshift Sunucusuz, veri ambarı altyapısını ayarlayıp yönetmeye gerek kalmadan analizleri saniyeler içinde daha verimli şekilde çalıştırmanızı ve ölçeklendirmenizi sağlayan, Amazon Redshift’in sunucusuz seçeneğidir. Redshift Sunucusuz sayesinde veri analistleri, geliştiriciler, iş uzmanları ve veri bilimcileri dâhil her kullanıcı, verileri veri ambarına yükleyip sorgulamak suretiyle kolayca öngörüler elde edebilir.

AWS Yönetim Konsolu’nda sadece birkaç adımda “Configure Amazon Redshift Serverless” (Amazon Redshift Sunucusuz’u yapılandır) ögesini seçerek veri sorgulamaya başlayabilirsiniz. Hava durumu verileri, nüfus sayımı verileri ve karşılaştırmalı değerlendirme veri kümeleri gibi önceden yüklenen örnek veri kümelerinin yanı sıra örnek sorgulardan da faydalanarak analizleri hemen başlatabilirsiniz. Veritabanları, şemalar, tablolar oluşturabilir ve Amazon S3, Amazon Redshift veri paylaşımlarından veri yükleyebilir veya mevcut bir Redshift tedarik edilen küme anlık yedeğinden geri yükleyebilirsiniz. Ayrıca Amazon S3 veri gölünde (Parquet veya ORC gibi) açık biçimlerde doğrudan veri sorgulayabilir ya da Amazon Aurora, Amazon RDS PostgreSQL ve MySQL gibi operasyonel veri tabanlarında veri sorgulayabilirsiniz. Kullanmaya Başlama Kılavuzu’na bakın.

Veri ambarı yönetimi konusunda deneyime sahip değilseniz kümeleri kurma, yapılandırma, yönetme veya ambarı ayarlama konusunda endişelenmenize gerek yoktur. Verilerinizden anlamlı öngörüler oluşturmaya veya veriler aracılığıyla temel iş sonuçlarınıza ulaşmaya odaklanabilirsiniz. Sadece kullandığınız kadar ödeyerek maliyetleri yönetilebilir seviyede tutarsınız. Amazon Redshift'in üst düzey performansından, zengin SQL özelliklerinden, data lake'ler ve operasyonel veri ambarları ile sorunsuz entegrasyonundan, yerleşik tahmine dayalı analiz ve veri paylaşımı özelliklerinden faydalanmaya devam edersiniz. Veri ambarınız üzerinde ayrıntılı denetime sahip olmanız gerekiyorsa Redshift kümeleri tedarik edebilirsiniz.

Amazon Redshift’in karmaşık birleştirmeler, Amazon S3 veri gölü ve operasyonel veri tabanlarında doğrudan veri sorguları, gerçekleştirilmiş görünümler, depolanmış prosedürler, yarı yapılandırılmış veri desteği ve makine öğrenimi gibi tüm zengin analiz fonksiyonlarını ve uygun ölçekte yüksek performansını kullanmaya devam edebilirsiniz. Amazon Redshift’in entegre olduğu tüm ilişkili hizmetler (Amazon Kinesis, AWS Lambda, Amazon QuickSight, Amazon SageMaker, Amazon EMR, AWS Lake Formation ve AWS Glue gibi), Amazon Redshift Sunucusuz ile çalışmaya devam etmektedir.

Tüm analiz kullanım örneklerini çalıştırmaya devam edebilirsiniz. Basit bir kullanmaya başlama iş akışı, otomatik ölçeklendirme ve kullandığın kadar ödeme özelliği sayesinde Amazon Redshift Sunucusuz deneyimi, artık hızla kullanılmaya başlanması gereken geliştirme ve test ortamlarını, geçici iş analizlerini, değişkenlik gösteren ve öngörülemez işlem gereksinimlerini ve aralıklı ya da düzensiz iş yüklerini çalıştırmayı daha da verimli ve uygun maliyetli hâle getirmektedir.

Veri alımı ve yükleme

Amazon Redshift'e Amazon S3, Amazon RDS, Amazon DynamoDB, Amazon EMR, AWS Glue, AWS Veri İşlem Hattı gibi çeşitli veri kaynaklarından veya Amazon EC2'deki ya da şirket içindeki başka herhangi bir SSH özellikli ana sunucudan veri yükleyebilirsiniz. Amazon Redshift, veri ambarı kümenize veri alma hızını en üst düzeye çıkarabilmeniz için verilerinizi paralel olarak her işlem düğümüne yüklemeye çalışır. İstemciler ODBC veya JDBC kullanarak Amazon Redshift’e bağlanabilir ve “insert” SQL komutları çalıştırarak veri ekleyebilir. S3 veya DynamoDB tarafından yöntemler her işlem düğümüne paralel olarak yüklenirken SQL ekleme bildirimlerinin tek bir baş düğüm aracılığıyla yüklenmesi nedeniyle bunun daha yavaş olduğunu lütfen unutmayın. Amazon Redshift'e veri yükleme konusunda daha ayrıntılı bilgi edinmek için lütfen Kullanmaya Başlama Kılavuzu'muza bakın.

Redshift otomatik kopyalama, Amazon S3 klasörlerini izleyerek ve müşteri müdahalesi olmadan yeni dosyaları alarak kopyalama ifadelerini otomatikleştirme özelliği sağlar. Otomatik kopyalama olmadığında bir kopyalama ifadesi mevcut dosyalar için dosya alma sürecini hemen başlatır. Otomatik kopyalama, mevcut kopya komutunu genişletir ve 1/ yeni dosyalar için belirtilen Amazon S3 yollarını izleyerek dosya alım sürecini otomatikleştirme, 2/ tekrarlanan alım görevleri için yeni kopya ifadeleri oluşturma ve çalıştırma ihtiyacını azaltmak üzere kopya yapılandırmalarını yeniden kullanma ve 3/ veri çoğaltmayı önlemek için yüklenen dosyaları takip etme olanağı sağlar.

Kullanmaya başlamak için müşterilerin, ilişkili IAM rolleri kullanılarak Redshift kümesi/sunucusuz uç noktası tarafından erişilebilen bir Amazon S3 klasörüne sahip olmaları ve hedef olarak kullanılacak bir Redshift tablosu oluşturmaları gerekir. Amazon S3 yolu ve Redshift tablosu hazır olduğunda müşteriler, kopya komutunu kullanarak bir kopyalama işi oluşturabilirler. Kopyalama işi oluşturulduktan sonra Redshift, belirtilen Amazon S3 yolunu arka planda izlemeye başlar ve yeni dosyaları otomatik olarak hedef tabloya kopyalamak için kullanıcı tarafından belirlenen kopyalama ifadelerini başlatır.

Başlıca kullanım örnekleri şunlardır: 1/ Veri alımı ve dönüştürme hatlarının (toplu iş ve akış) bir parçası olarak verilere erişen ve Amazon Redshift’e veri yükleyen Apache Spark işlerini çalıştırmak için Amazon EMR ve AWS Glue kullanan müşteriler 2/ Apache Spark kullanarak makine öğrenimi gerçekleştirmek için Amazon SageMaker kullanan ve özellik mühendisliği ile dönüştürme için Amazon Redshift’te depolanan verilere erişmesi gereken müşteriler. 3/ Amazon Redshift’teki verilerde etkileşimli analiz gerçekleştirmek için Apache Spark kullanan Amazon Athena müşterileri.

Baikal aşağıdaki faydaları sağlar:

  • Spark'ın sertifikasız sürümlerini kurmak ve bunların bakımını yapmak için gereken manuel adımlar konusunda endişelenmenize gerek kalmadan Apache Spark uygulamalarını Amazon Redshift'teki veriler üzerinde başlatmak ve çalıştırmak için kullanım kolaylığı
  • Apache Spark'ı Amazon EMR, AWS Glue, Amazon Athena ve Amazon SageMaker gibi çeşitli AWS hizmetlerinden Amazon Redshift ile birlikte minimum yapılandırmayla kullanma kolaylığı
  • Amazon Redshift'te Apache Spark uygulamalarını çalıştırırken gelişmiş performans

Amazon Redshift’e Amazon Aurora Sıfır ETL, Amazon Aurora’dan gelen işlem verilerini yazıldığı birkaç saniye içinde Amazon Redshift’te kullanılabilir hâle getirmek için tam olarak yönetilen bir çözüm sunarak Amazon Aurora ve Amazon Redshift müşterilerinin petabaytlarca işlem verisi üzerinde neredeyse gerçek zamanlı analiz ve makine öğrenimi çalıştırmalarına olanak tanır. Amazon Redshift’e Amazon Aurora Sıfır ETL sayesinde müşteriler, Amazon Redshift ile analiz etmek istedikleri verileri içeren Amazon Aurora tablolarını seçerler ve bu özellik, şemayı ve verileri sorunsuz bir şekilde Amazon Redshift’te çoğaltır. Müşterilerin karmaşık veri işlem hattı oluşturma ve yönetme ihtiyacını azaltır, böylece bunun yerine uygulamalarını iyileştirmeye odaklanabilirler. Amazon Redshift’e Amazon Aurora Sıfır ETL sayesinde müşteriler, birden fazla Amazon Aurora veri tabanı kümesindeki verileri aynı Amazon Redshift bulut sunucusuna çoğaltarak çeşitli uygulamalarda kapsamlı öngörüler elde edebilir ve aynı zamanda temel analitik varlıklarını birleştirerek önemli ölçüde maliyet tasarrufu ve operasyonel verimlilik sağlayabilirler. Amazon Redshift’e Amazon Aurora Sıfır ETL sayesinde müşteriler, Amazon Redshift’in gerçekleştirilmiş görünümler, veri paylaşımı ve birden çok veri deposuna ve veri gölüne birleştirilmiş erişim gibi temel analiz ve makine öğrenimi özelliklerine de erişebilir. Bu, müşterilerin iş kararları için bilgi sağlayan, zamana duyarlı öngörüleri etkili bir şekilde elde etmek için neredeyse gerçek zamanlı ve temel analitiği birleştirmelerini sağlar. Ayrıca müşteriler işlemler için Amazon Aurora’yı ve analizler için Amazon Redshift’i kullandığından paylaşılan bilgi işlem kaynakları yoktur; bu da yüksek performanslı ve operasyonel olarak kararlı bir çözüm sunar.

Amazon Redshift ile Amazon Aurora Sıfır ETL Entegrasyonu, işlemsel analiz için iki hizmet arasında sorunsuz entegrasyon sunar.

Akış verileri, bir akışı sorguladığınızda zamanla değişen bir ilişkinin gelişimini yakaladığınız için geleneksel veri tabanı tablolarından farklıdır. Öte yandan tablolar, bu zamanla değişen ilişkinin belirli bir noktada anlık yedeğini yakalar. Amazon Redshift müşterileri, normal tablolarda çalışmaya ve “ELT” gibi geleneksel bir toplu işlem modelini kullanarak verilerde aşağı akış işlemesi (yani, dönüştürmeleri) gerçekleştirmeye alışkındır. Redshift Gerçekleştirilmiş Görünümler’i (MV’ler) kullanmak için bir yöntem sunuyoruz; böylece müşteriler, ELT iş akışlarını desteklemek için mümkün olan en hızlı şekilde, sorgulandığı ana kadar birikmiş akışın belirli bir noktadaki görünümünü kolayca gerçekleştirebilirler.

Veri paylaşımı

Başlıca kullanım örnekleri şunlardır:

  • Çok sayıda BI/analiz kümesiyle veri paylaşımı yaparak okuma iş yükü yalıtımı ve isteğe bağlı ücretlendirme olanağı sağlayan bir merkezi ETL kümesi.
  • Harici tüketicilerle veri paylaşımı yapan bir veri sağlayıcısı.
  • Müşteriler, ürünler gibi ortak veri kümelerini farklı iş grupları genelinde paylaşma ve geniş analiz ile veri bilimi için iş birliği yapma.
  • Bir veri ambarını merkeziyetsizleştirerek yönetimi basitleştirme.
  • Geliştirme, test ve üretim ortamları arasında veri paylaşımı yapma.
  • Redshift verilerine diğer AWS analiz hizmetlerinden erişme.

Veri tabanları arası sorgular sayesinde hangi veri tabanına bağlı olduğunuz fark etmeksizin, erişim sahibi olduğunuz herhangi bir Redshift veri tabanını kolayca sorgulayabilir ve aldığınız verileri birleştirebilirsiniz. Hem kümede yerel olarak bulunan veritabanları hem de uzak kümelerden erişime açılmış paylaşılan veri kümeleri buna dahil olabilir. Veri tabanları arası sorgular size çok kiracılı yapılandırmaları desteklemek üzere verileri ayrı veri tabanlarında organize etme esnekliği sunar.

AWS Veri Değişimi, AWS müşterilerinin AWS'de üçüncü taraf verilerini güvenli bir şekilde değiş tokuş etmesini ve kullanmasını daha verimli hale getirir. Veri analistleri, ürün müdürleri, portföy yöneticileri, veri bilimcileri, kantitatif analistler, klinik deneme teknisyenleri ve neredeyse her sektörden geliştiriciler analiz geliştirmek, makine öğrenimi modellerini eğitmek ve veriye dayalı kararlar almak amacıyla daha fazla veriye erişmek istemektedir. Ancak, çok sayıda sağlayıcıdan gelen verileri bir arada bulabileceğiniz tek bir adres ve sağlayıcıların verileri ulaştırma şeklinde tutarlılık olmadığı için bu kişiler gönderilen fiziksel ortam, FTP kimlik bilgileri ve ısmarlama API çağrılarının bir karışımı ile uğraşmak zorunda kalır. Buna karşılık, çok sayıda kuruluş verilerini araştırma amaçları veya ticari amaçlar doğrultusunda kullanıma açmak istemektedir ancak veri dağıtım, yetkilendirme ve faturalandırma teknolojisini geliştirip devamlılığını sağlamak hem oldukça zor hem de pahalıdır ve bu durum değerli verilerin arzını baskılamaktadır.

Ölçeklenebilirlik ve eş zamanlılık

Amazon Redshift Sunucusuz, veri ambarı kapasitesini otomatik olarak sağlar ve temel kaynakları akıllı bir şekilde ölçeklendirir. Amazon Redshift Sunucusuz, en zorlu ve değişken iş yükleri için bile sürekli olarak yüksek performans ve basitleştirilmiş operasyonlar sunmak için kapasiteyi saniyeler içinde ayarlar. Eş Zamanlılık Ölçeklendirme özelliği sayesinde sınırsız sayıda kullanıcıyı ve eş zamanlı sorguyu, tutarlı şekilde hızlı sorgu performansıyla destekleyebilirsiniz. Eş zamanlılık ölçeklendirme etkinleştirilince, kümenizde sorguların kuyruğa alınmasında artış gözlemlendiğinde Amazon Redshift otomatik olarak küme kapasitesi ekler.

Manuel ölçeklendirme için sorgu performansını artırmak veya fazla CPU, bellek ya da G/Ç kullanımına yanıt vermek istiyorsanız AWS Yönetim Konsolu veya ModifyCluster API'si aracılığıyla Esnek Yeniden Boyutlandırma'yı kullanarak veri ambarı kümenizdeki düğüm sayısını artırabilirsiniz. Veri ambarı kümenizi değiştirdiğinizde istediğiniz değişiklikler anında uygulanır. Redshift veri ambarı kümenize yönelik işlem kullanımı, depolama kullanımı ve okuma/yazma trafiğine ilişkin ölçümlere AWS Yönetim Konsolu veya Amazon CloudWatch API’leri aracılığıyla ücretsiz olarak erişebilirsiniz. Amazon CloudWatch özel ölçüm işlevi aracılığıyla kullanıcı tanımlı ölçümler de ekleyebilirsiniz.

Amazon Redshift Spectrum’da, Amazon S3’te depolanan aynı verilere erişen birden çok Redshift kümesi çalıştırabilirsiniz. Farklı kullanım örnekleri için farklı kümeler kullanabilirsiniz. Örneğin, bir kümeyi standart raporlama için kullanırken başka bir kümeyi veri bilimi sorguları için kullanabilirsiniz. Pazarlama ekibiniz, operasyon ekibinizin kümelerinden farklı olarak kendi kümelerini kullanabilir. Redshift Spectrum, Amazon S3’ten gelen verileri okumak ve işlemek için sorgunuzun yürütülmesini paylaşılan bir kaynak havuzundan birkaç Redshift Spectrum çalışanına otomatik olarak dağıtır ve kalan işlemler için sonuçları tekrar Redshift kümenize çeker.

Duruma bağlı. Eş Zamanlılık Ölçeklendirme özelliği kullanılırken eş zamanlılık ölçeklendirme esnasında küme, okuma ve yazma için tam olarak erişilebilir durumdadır. Esnek yeniden boyutlandırma ile dört ila sekiz dakika süren yeniden boyutlandırma esnasında küme erişilebilir olmaz. Yönetilen depolamada Redshift RA3 depolama esnekliğiyle, küme tam olarak erişilebilirdir ve veriler, yönetilen depolama ile işlem düğümleri arasında otomatik olarak taşınır.

Esnek Yeniden Boyutlandırma, tek bir Redshift kümesindeki düğümleri dakikalar içinde ekleyerek veya kaldırarak sorgu performansını yönetir. Örneğin, günün belirli saatlerine veya ay sonu raporlamasına yönelik bir ETL iş yükünün zamanında tamamlanabilmesi için ek Amazon Redshift kaynakları gerekebilir. Eş Zamanlılık Ölçeklendirme, daha fazla küme kaynağı ekleyerek genel sorgu eş zamanlılığını artırır.

Hayır. Eş Zamanlılık Ölçeklendirme, Amazon Redshift kaynaklarından oluşan ve çok büyük oranda ölçeklendirilebilen bir havuzdur ve müşteriler buna doğrudan erişemez.

Güvenlik

Amazon Redshift; tek oturum açma (SSO) için yerleşik kimlik yönetimi ve federasyonu, çok faktörlü kimlik doğrulama, sütun düzeyinde erişim kontrolü, kayıt seviyesinde güvenlik, rol tabanlı erişim kontrolü ve Amazon Sanal Özel Bulut (Amazon VPC) ile sektör lideri güvenliği destekler. Amazon Redshift ile verileriniz taşınırken ve bekleme durumundayken şifrelenir. Tüm Amazon Redshift güvenlik özellikleri, en zorlu güvenlik, gizlilik ve uyumluluk gereksinimlerini karşılamak için hiçbir ek ücret olmadan kullanıma hazır olarak sunulur. ISO 27001, SOC, HIPAA/HITECH ve FedRAMP dâhil olmak üzere diğer tüm sağlayıcılardan daha fazla güvenlik standardını ve uyumluluk sertifikasını destekleyen AWS’nin avantajlarından yararlanırsınız.

Evet, Amazon Redshift rol tabanlı erişim denetimi desteği sağlar. Rol tabanlı erişim kontrolü bir kullanıcıya bir veya daha fazla rol atamanızı ve role göre sistem ve nesne izinleri atamanızı sağlar. Kullanıma hazır sistem rolü tabanlı kök kullanıcı, dba, işlemci ve güvenlik yöneticilerini kullanabilir veya kendi rollerinizi oluşturabilirsiniz.

AWS Lambda kullanıcı tanımlı işlevleri (UDF’ler), bir AWS Lambda işlevini Amazon Redshift’te bir UDF olarak kullanmanıza ve bunu Redshift SQL sorgularından çağırmanıza olanak tanır. Bu işlevsellik, diğer hizmetlerle veya üçüncü taraf ürünleriyle daha sıkı entegrasyon sağlamak üzere SQL sorgunuz için özel uzantılar yazmanızı sağlar. Protegrity gibi satıcılarla entegrasyon kurarak verilerin haricî olarak belirtece dönüştürülmesini, maskelenmesini, tanımlanmasını veya kimlik bilgilerinden arındırılmasını mümkün kılmak, ayrıca hassas verileri her kullanıcının izinlerine ve gruplarına bağlı olarak sorgu anında koruma altına almak ya da korumadan çıkarmak için Lambda UDF’leri yazabilirsiniz.

Dinamik veri maskeleme desteği sayesinde müşteriler, Veri Maskeleme politikalarını yöneterek hassas verilerini kolayca koruyabilir ve ayrıntılı erişimi kontrol edebilirler. Birden çok kullanıcıya sahip uygulamalarınız ve tüm kullanıcılara sunulamayan hassas verileri olan nesneleriniz olduğunu varsayalım. Farklı kullanıcı gruplarına vermek istediğiniz farklı ayrıntılı güvenlik düzeyi sağlama gereksinimleriniz var. Redshift Dinamik Veri Maskeleme, müşterilerin tutarlı, biçimi koruyan ve geri alınamaz maskelenmiş veri değerleri tanımlamasına izin verecek şekilde yapılandırılabilir. Özellik GA olduğunda hemen kullanmaya başlarsınız. Güvenlik yöneticileri yalnızca birkaç komutla politika oluşturabilir ve uygulayabilir.

Evet. Microsoft Azure Active Directory, Active Directory Federation Services, Okta, Ping Federate veya diğer SAML uyumlu kimlik sağlayıcıları gibi kurumsal kimlik sağlayıcılarını kullanmak isteyen müşteriler, Amazon Redshift’i tek oturum açma sağlayacak şekilde yapılandırabilirler. Microsoft Azure Active Directory (AD) kimlik bilgileriyle Amazon Redshift kümesinde oturum açabilirsiniz. Bu, Redshift’te Azure Active Directory kimliklerini çoğaltmadan Redshift’te oturum açabilmenizi sağlar.

Evet. Amazon Redshift kümenizde kimlik doğrulaması yaparken ek güvenlik için çok faktörlü kimlik doğrulamayı (MFA) kullanabilirsiniz.

Erişilebilirlik ve dayanıklılık

Amazon Redshift, veri ambarı kümenizde başarısız olan düğümü otomatik olarak algılayıp değiştirir. Yoğun İşlem (DC) ve Yoğun Depolama (DS2) kümelerinde yüksek veri dayanıklılığı sağlamak için veriler işlem düğümlerinde depolanır. Bir düğüm değiştirildiğinde, veriler diğer düğüm üzerindeki yansıtma kopyasından yenilenir. RA3 kümeleri ve Redshift sunucusuz, veriler Amazon S3’te depolandığı ve yerel sürücü, bir veri önbelleği olarak kullanıldığı için aynı şekilde etkilenmez. Yedek bir düğüm tedarik edilip veri tabanına eklenene kadar veri ambarı kümesi sorgulara ve güncelleştirmelere kapalı olur. Amazon Redshift, yedek düğümünüzü anında erişilebilir hâle getirir ve verilerinizi olabildiğince hızlı bir şekilde sorgulamaya başlayabilmeniz için önce Amazon S3’ten en sık erişilen verileri yükler. Tek düğümlü kümeler veri replikasyonunu desteklemez. Bir sürücünün başarısız olması durumunda kümeyi S3’teki anlık yedekten geri yüklemeniz gerekir. Üretim için en az iki düğüm kullanılmasını öneririz.

Amazon Redshift veri ambarınız single-AZ dağıtımıysa ve kümenin Erişilebilirlik Alanı erişilemez hâle gelirse Amazon Redshift hiçbir veri kaybı veya uygulama değişikliği yaşanmadan kümenizi otomatik olarak başka bir AWS Erişilebilirlik Alanı’na (AZ) taşır. Bunu aktifleştirmek için kümenizin yapılandırma ayarlarında taşınma özelliğini etkinleştirmeniz gerekir.

Müşteriler, single-AZ dağıtımlarından farklı olarak artık multi-AZ dağıtımında veri ambarlarını çalıştırarak Redshift’in erişilebilirliğini iyileştirebilir. Multi-AZ dağıtımı, veri ambarınızı birden çok AWS Erişilebilirlik Alanı’nda (AZ) aynı anda çalıştırmanıza ve öngörülemeyen hata senaryolarında çalışmaya devam etmenize olanak tanır. Multi-AZ dağıtımı, tek bir uç nokta ile tek bir veri ambarı olarak yönetildiğinden iş sürekliliğini sürdürmek için herhangi bir uygulama değişikliği gerekmez. Multi-AZ dağıtımları, otomatik olarak kurtarma kapasitesini garanti ederek kurtarma süresini azaltır ve en yüksek düzeylerde erişilebilirlik ve AZ hatalarına karşı dayanıklılık gerektiren iş açısından kritik analitik uygulamalara sahip müşteriler için tasarlanmıştır. Bu aynı zamanda müşterilerin AWS Well-Architected Çerçevesi’nin Güvenilirlik Bileşeni önerileriyle daha uyumlu bir çözüm uygulamasına olanak tanır. Amazon Redshift Multi-AZ hakkında daha fazla bilgi için buraya bakın.

RPO, Kurtarma Noktası Hedefi (Recovery Point Objective) ifadesinin kısaltmasıdır ve arıza durumunda veri güncelliği garantisini açıklayan bir terimdir. RPO, son veri kurtarma noktasından itibaren kabul edilebilir maksimum süredir. Bu, son kurtarma noktası ile hizmetin kesintiye uğraması arasında nelerin kabul edilebilir bir veri kaybı olarak ele alınabileceğini belirler. Redshift Multi-AZ, RPO = 0'ı destekler; yani bir arıza durumunda verilerin geçerli ve güncel olması garanti edilir. Lansman öncesi testlerimiz, muhtemel olmayan bir AZ arızası durumunda Amazon Redshift Multi-AZ dağıtımlarıyla RTO'nun 60 saniyenin altında veya daha kısa olduğunu bulmuştur.

Redshift Relocation, tüm yeni RA3 kümelerinde ve sunucusuz uç noktalarda varsayılan olarak etkindir; bu, büyük ölçekli bir kesinti durumunda herhangi bir veri kaybı veya ek maliyet olmaksızın bir veri ambarının başka bir AZ’de yeniden başlatılmasına olanak tanır. Yeniden konumlandırma kullanımı ücretsiz olsa da sınırlamalar, kurtarılan AZ’deki kaynakların erişilebilirliğine bağlı olarak en iyi çaba yaklaşımı olması ve Kurtarma Süresi Hedefi’nin (RTO) yeni bir küme başlatmayla ilgili diğer sorunlardan etkilenebilmesidir. Bu, 10 ila 60 dakika kurtarma süresine neden olabilir. Redshift Multi-AZ, saniyeler içinde ölçülen bir RTO sunarak yüksek erişilebilirlik gereksinimlerini destekler ve yeni bir küme oluştururken kapasite sınırlamalarına veya diğer olası sorunlara tabi olmayacağı için garantili kesintisiz çalışma sunar.

Sorgulama ve analiz

Evet, sektör standardı SQL kullanmakta olan Amazon Redshift’e, standart JDBC ve ODBC sürücüleri kullanılarak erişilir. Amazon Redshift özel JDBC ve ODBC sürücülerini Redshift Console'un Connect Client (İstemci Bağlama) sekmesinden indirebilirsiniz. Popüler BI ve ETL satıcılarıyla olan entegrasyonumuzu doğruladık ve bunlardan bazıları, verilerinizi yükleyip analiz etmeye başlamanıza yardımcı olmak için ücretsiz deneme seçenekleri sunuyor. Dilerseniz AWS Pazar Yeri'ne giderek Amazon Redshift ile çalışacak şekilde tasarlanmış çözümleri dakikalar içinde dağıtıp yapılandırabilirsiniz.

Amazon Redshift Spectrum, tüm Amazon Redshift istemci araçlarını destekler. İstemci araçları ODBC ve JDBC bağlantıları kullanarak Amazon Redshift kümesinin uç noktasına bağlanmaya devam edebilir. Değişiklik gerekmez.

Tam olarak aynı söz dizimini kullanırsınız ve Redshift Spectrum’daki tablolara erişim için Redshift kümenizin yerel depolama alanındaki tablolarla aynı sorgulama özelliklerine sahip olursunuz. Haricî tablolara, bunlar kaydedilirken kullanılan CREATE EXTERNAL SCHEMA komutunda tanımlanan şema adı kullanılarak başvurulur.

Amazon Redshift Spectrum şu anda Avro, CSV, Grok, Amazon Ion, JSON, ORC, Parquet, RCFile, RegexSerDe, Sequence, Text ve TSV dahil olmak üzere birçok açık kaynaklı veri biçimini desteklemektedir.<br>Amazon Redshift Spectrum şu anda Gzip ve Snappy sıkıştırmayı desteklemektedir.

Yerel tablolarda olduğu gibi, sorgunuzda şema adını şema_adı.tablo_adı biçiminde kullanarak tam olarak hangisini kast ettiğinizi seçebilirsiniz.

Evet. CREATE EXTERNAL SCHEMA komutu Hive Metastore’ları destekler. Şu anda Hive Metastore’a yönelik DDL desteği sunmuyoruz.

Bu bilgiyi edinmek için SVV_EXTERNAL_TABLES adlı sistem tablosunu sorgulayabilirsiniz.

Evet. Amazon Redshift ML özelliği, SQL kullanıcılarının aşina oldukları SQL komutlarını kullanarak makine öğrenimi (ML) modellerini oluşturmasını, eğitmesini ve dağıtmasını kolaylaştırır. Amazon Redshift ML, tam olarak yönetilen bir makine öğrenimi hizmeti olan Amazon SageMaker ile Amazon Redshift'teki verilerinizden yararlanmanıza olanak tanır. Amazon Redshift, hem denetimsiz öğrenmeyi (K-Means) hem de denetimli öğrenmeyi (Autopilot, XGBoost, MLP algoritmaları) destekler. Önceden oluşturulmuş Lambda UDF işlevleriyle SQL sorgularındaki metin alanlarını çevirmek, düzeltmek ve analiz etmek için AWS Language AI hizmetlerini de kullanabilirsiniz. Blog gönderisini inceleyin.

Amazon Redshift; her türlü geleneksel, bulut temelli ve container'lı, sunucusuz web hizmetleri tabanlı ve olay odaklı uygulamalarla Amazon Redshift'teki verilerinize zahmetsizce erişmek için kullanabileceğiniz bir Veri API'si sağlar. Sürücüleri yapılandırmanız ve veritabanı bağlantılarını yönetmeniz gerekmediği için Veri API'si, Amazon Redshift erişimini basitleştirir. Bunun yerine, Veri API'si tarafından sağlanan güvenli bir API uç noktasını çağırarak bir Amazon Redshift kümesinde SQL sorguları çalıştırabilirsiniz. Veritabanı bağlantılarını yönetme ve verileri arabelleğe alma işini Veri API'si üstlenir. Veri API'si zaman uyumsuz olduğundan, sonuçlarınızı daha sonra alabilirsiniz. Sorgu sonuçlarınız 24 saat boyunca depolanır.

Veri API’si hem IAM kimlik bilgilerini hem de AWS Gizli Bilgi Yöneticisi’nden gizli anahtar kullanımını desteklemektedir. Veri API’sinin AWS Kimlik ve Erişim Yönetimi (IAM) kimlik bilgilerini federe etmesi sayesinde API çağrılarında veri tabanı kimlik bilgilerini aktarmadan Okta veya Azure Active Directory gibi kimlik bilgileri sağlayıcılarını ya da Gizli Bilgi Yöneticisi’nde depolanan veri tabanı kimlik bilgilerini kullanabilirsiniz.

Evet, aws redshift-data komut satırı seçeneğiyle Veri API’sini AWS CLI’dan kullanabilirsiniz.

Veri API’sini AWS Lambda, AWS Cloud9, AWS AppSync ve Amazon EventBridge gibi diğer hizmetlerden kullanabilirsiniz.

Hayır, Veri API'sini kullanmaya ilişkin ayrı bir ücret söz konusu değildir.

Sıfır ETL entegrasyonları

İşlem verilerine neredeyse gerçek zamanlı erişime ihtiyaç duyduğunuzda Amazon Redshift ile Aurora sıfır ETL entegrasyonunu kullanmalısınız. Bu entegrasyon, basit SQL komutlarıyla Amazon Redshift ML'den yararlanmanızı sağlar.

Amazon Redshift ile Aurora sıfır ETL entegrasyonu; ABD Doğu (Ohio), ABD Doğu (Kuzey Virginia), ABD Batı (Oregon), Asya Pasifik (Singapur), Asya Pasifik (Sidney), Asya Pasifik (Tokyo), Avrupa (Frankfurt), Avrupa (İrlanda) ve Avrupa (Stokholm) bölgelerinde Aurora MySQL sürüm 3.05 (MySQL 8.0.32 ile uyumlu) ve üzeri için Aurora MySQL Uyumlu Sürüm'de mevcuttur. Amazon Redshift ile Aurora sıfır ETL entegrasyonu, ABD Doğu (Ohio) bölgesindeki Aurora PostgreSQL 15.4 için Aurora PostgreSQL Uyumlu Sürüm'de mevcuttur.

Amazon Redshift ile Aurora sıfır ETL entegrasyonu, karmaşık veri işlem hatları oluşturma ve bakım yapma ihtiyacınızı ortadan kaldırır. Tek veya birden fazla Aurora veri tabanı kümesinden gelen verileri tek bir Amazon Redshift veri tabanı kümesinde birleştirebilir ve Amazon Aurora'dan gelen petabaytlarca işlem verisi üzerinde Amazon Redshift kullanarak neredeyse gerçek zamanlı analiz ve ML çalıştırabilirsiniz.

Amazon Redshift ile Aurora sıfır ETL entegrasyonu, Amazon Redshift Sunucusuz ve Amazon Aurora Sunucusuz v2 ile uyumludur. Hem Aurora Sunucusuz v2 hem de Amazon Redshift Sunucusuz'u kullanırken veri işlem hatları için herhangi bir altyapıyı yönetmek zorunda kalmadan işlem verileri üzerinde neredeyse gerçek zamanlı analiz gerçekleştirebilirsiniz.

Sıfır ETL entegrasyonunu oluşturmak için Amazon RDS konsolunu kullanmak suretiyle Aurora kaynağını ve Amazon Redshift hedefini belirterek başlayabilirsiniz. Entegrasyon oluşturulduktan sonra Aurora veri tabanı Amazon Redshift'e çoğaltılır ve ilk tohumlama tamamlandıktan sonra verileri sorgulamaya başlayabilirsiniz. Daha fazla bilgi için Amazon Redshift ile Aurora sıfır ETL entegrasyonlarına yönelik kullanmaya başlama kılavuzunu okuyun.

Aurora'dan Amazon Redshift'e sıfır ETL entegrasyonu, kaynak Aurora veri tabanı ile hedef Amazon Redshift kümesi arasındaki veri tutarlılığını sağlamak için işlemleri atomik olarak çoğaltır.
İşte bu entegrasyonla işlemlerin atomikliği hakkında bazı önemli noktalar:

  • Yalnızca Aurora'da taahhüt edilen işlemler Amazon Redshift'e çoğaltılır. Taahhüt edilmemiş veya geri alınmış işlemler uygulanmaz.
  • Entegrasyon, her işlemi Amazon Redshift'e atomik olarak uygulamak için iki aşamalı bir taahhüt işlemi kullanır. İşlemdeki tüm veri değişiklikleri uygulanır veya bir hata oluşursa hiçbiri uygulanmaz.
  • Kaynak ve hedef arasında işlem tutarlılığı korunur. Çoğaltmadan sonra, belirli bir işlemin verileri hem Aurora hem de Amazon Redshift'te tutarlı olacaktır.
  • DDL veya DML yoluyla şema değişiklikleri de bütünlüğü korumak için atomik olarak uygulanır.
  • İşlemlerin atomik uygulaması, veri tabanları arasında kısmi işlemlerin veya tutarsız veri durumlarının oluşmamasını sağlar.
 

Amazon Redshift ile Aurora sıfır ETL entegrasyonu, kaynak Aurora veri tabanı ile hedef Amazon Redshift kümesi arasında tam işlem tutarlılığını korur.

Şema değişikliklerinin nasıl ele alındığına dair bazı önemli noktalar şunlardır:

  • CREATE TABLE, ALTER TABLE, DROP TABLE vb. gibi DDL ifadeleri, Aurora'dan Amazon Redshift'e otomatik olarak çoğaltılır.
  • Entegrasyon, çoğaltılmış şema değişiklikleri için Amazon Redshift tablolarında gerekli denetimleri ve ayarlamaları yapar. Örneğin, Aurora'da eklenecek bir sütun, Amazon Redshift'e de eklenecektir.
  • Çoğaltma ve şema senkronizasyonu, kaynak ve hedef veri tabanları arasında minimum gecikmeyle otomatik olarak gerçek zamanlı bir şekilde gerçekleşir.
  • DML değişiklikleri DDL değişikliklerine paralel olarak gerçekleşse bile şema tutarlılığı korunur.

Sıfır ETL entegrasyonu ile çoğaltılan verileri dönüştürmek için yerel Amazon Redshift veri tabanınızda gerçekleştirilmiş görünümler oluşturabilirsiniz. Yerel veri tabanınıza bağlanın ve hedef veri tabanlarına erişmek için veri tabanları arası sorguları kullanın. Üç bölümlü gösterimle tam nitelikli nesne adlarını kullanabilir (hedef-veri-tabanı-adı.şema-adı.tablo-adı) veya hedef veri tabanına ve şema çiftine başvuran harici bir şema oluşturarak iki bölümlü gösterim (harici-şema-adı.tablo-adı) kullanabilirsiniz.

Sıfır ETL ve veri değişikliklerinin sürekli işlenmesi hiçbir ek ücret alınmadan sunulur. Sıfır ETL entegrasyonunun parçası olarak üretilen değişiklik verilerini oluşturmak ve işlemek üzere kullanılan mevcut Amazon RDS ve Amazon Redshift kaynakları için ödeme yaparsınız. Bu kaynaklar şunları içerebilir:

  • Gelişmiş binlog etkinleştirilerek kullanılan ek G/Ç ve depolama alanı
  • Amazon Redshift veri tabanlarınızın başlatılması için ilk veri aktarımının anlık yedek dışa aktarma maliyetleri
  • Çoğaltılmış verileri depolamak için ek Amazon Redshift depolama alanı
  • Verileri kaynaktan hedefe taşımak için AZ arası veri aktarım maliyetleri

Daha fazla bilgi için Aurora fiyatlandırma sayfasını ziyaret edin.

Yedekleme ve geri yükleme

Amazon Redshift RA3 kümeleri ve Amazon Redshift Sunucusuz, kullanılabilir verilerin daima en son kopyasını barındıran Redshift Tarafından Yönetilen Depolama’yı kullanır. DS2 ve DC2 kümeleri, kümedeki verileri yansıtarak bir arıza durumunda en son kopyanın mevcut olmasını sağlar. Yedekler tüm Redshift küme türlerinde otomatik olarak oluşturulup 24 saat süreyle saklanır ve sunucusuz sistemlerde son 24 saat için kurtarma noktaları sağlanır

Ayrıca süresiz olarak saklayabileceğiniz kendi yedeklerinizi de oluşturabilirsiniz. Bu yedekler herhangi bir zamanda oluşturulabilir ve Amazon Redshift otomatik yedekleri veya Amazon Redshift Sunucusuz kurtarma noktaları, daha uzun süreli saklama amacıyla bir kullanıcı yedeğine dönüştürülebilir.

Amazon Redshift aynı zamanda, olağanüstü durum kurtarma için anlık yedeklerinizi veya kurtarma noktalarınızı bir başka Bölgedeki Amazon S3’e zaman uyumsuz olarak çoğaltabilir.

Bir DS2 veya DC2 kümesinde ücretsiz yedek depolama alanı, veri ambarı kümesindeki düğümlerin toplam depolama boyutuyla sınırlıdır ve yalnızca etkin veri ambarı kümeleri için geçerlidir.

Örneğin, toplam 8 TB veri ambarı depolama alanınız varsa ücretsiz olarak en fazla 8 TB yedek depolama alanı sağlarız. Yedeklerinizin tutulma süresini bir günden uzun olacak şekilde ayarlamak isterseniz AWS Yönetim Konsolu'nu ya da Amazon Redshift API'lerini kullanarak bunu gerçekleştirebilirsiniz. Otomatik anlık yedekler hakkında daha fazla bilgi edinmek için lütfen Amazon Redshift Yönetim Kılavuzu’na bakın.

Amazon Redshift yalnızca değişen verileri yedeklediğinden, çoğu anlık yedek ücretsiz depolama alanınızın sadece küçük bir miktarını kullanır. Bir yedeği geri yüklemeniz gerektiğinde, yedek tutma aralığınız içinde tüm otomatik yedeklere erişebilirsiniz. Geri yüklenecek yedeği seçtiğinizde yeni bir veri ambarı kümesi tedarik eder ve verilerinizi buna geri yükleriz.

Otomatik yedeklerinizin saklandığı süreyi AWS Yönetim Konsolu veya ModifyCluster API'sinden RetentionPeriod parametresini değiştirerek yönetebilirsiniz. Otomatik yedeklemeyi tamamen kapatmak istiyorsanız tutma dönemini 0 değerine ayarlayabilirsiniz (önerilmez).

Bir veri ambarı kümesini sildiğinizde silme işleminin üzerine son bir anlık yedeğin oluşturulup oluşturulmayacağını belirtme olanağınız vardır. Bu, silinen veri ambarı kümesinin daha sonra geri yüklenmesine olanak sağlar. Veri ambarı kümenizin daha önce manuel olarak oluşturulmuş tüm anlık yedekleri saklanır ve bunları silmediğiniz sürece standart Amazon S3 fiyatları üzerinden faturalama yapılmaya devam eder.

İzleme ve bakım

Amazon Redshift veri ambarı kümenize ilişkin işlem kullanımı, depolama kullanımı ve okuma/yazma trafiği ölçümlerine AWS Yönetim Konsolu veya Amazon CloudWatch API'leri aracılığıyla ücretsiz olarak erişebilirsiniz. Amazon CloudWatch’un özel ölçüm işlevi aracılığıyla, kullanıcı tarafından tanımlanmış başka ölçümler ekleyebilirsiniz. AWS Yönetim Konsolu, tüm kümelerinizin durumunu ve performansını izlemenize yardımcı olacak bir izleme panosu sağlar. Amazon Redshift ayrıca, AWS Yönetim Konsolu aracılığıyla sorgu ve küme performansıyla ilgili bilgi sağlar. Bu bilgiler, sorgu planlarını ve yürütme istatistiklerini görüntüleyerek en çok sistem kaynağını hangi kullanıcıların ve sorguların tükettiğini görmenize ve performans sorunlarını tanılamanıza olanak tanır. Ayrıca, verilerinizin ve sorgularınızın tüm düğümlere dengeli bir şekilde dağıldığından emin olmak için işlem düğümlerinizin her birindeki kaynak kullanımını görebilirsiniz.

Amazon Redshift, düzenli aralıklarla bakım gerçekleştirerek düzeltmeleri, geliştirmeleri ve yeni özellikleri kümenize uygular. Kümeyi programlama yoluyla ya da Redshift Konsolu ile değiştirerek zamanlanan bakım aralıklarını değiştirebilirsiniz. Bu bakım aralıkları sırasında Amazon Redshift kümeniz normal işlemlere kapalı olur. Bölgelere göre bakım aralıkları ve planlamalar hakkında daha fazla bilgi edinmek için Amazon Redshift Yönetim Kılavuzu'ndaki Bakım Aralıkları bölümüne bakın.