Genel

Yenilikler sayfasından Amazon Redshift'teki yenilikleri öğrenebilirsiniz.
Daha detaylı bilgiler ve kullanım kılavuzu için Belgeler sayfasını ziyaret edin.

S: Amazon Redshift nedir?

Amazon Redshift, büyük ölçekte hızlı, kolay ve güvenli analizlerle öngörülere ulaşma hızınızı artıran, tam olarak yönetilen ve ölçeklenebilir bir bulut veri ambarıdır. Binlerce müşteri, terabaytlarca hatta petabaytlarca verisini analiz etme ve karmaşık analiz sorguları çalıştırma konusunda Amazon Redshift'e güvenmektedir. Operasyonel veritabanlarınız, data lake'leriniz, veri ambarınız ve üçüncü taraf veri kümeleriniz genelindeki tüm verileriniz ile ilgili gerçek zamanlı öngörüler ve tahmine dayalı analizler elde edebilirsiniz. Amazon Redshift, kullanmaya başladığınız andan itibaren bunların tümünü diğer bulut veri ambarlarına göre 3 kata kadar daha iyi bir fiyat performansında sunarak maliyetlerinizi öngörebilmenize yardımcı olur.

Amazon Redshift Sunucusuz, petabayt ölçeğinde analizleri saniyeler içinde çalıştırmanızı daha kolay hale getirerek veri ambarı kümelerinizi yapılandırıp yönetmenize gerek kalmadan hızlı öngörüler edinmenizi sağlar. Amazon Redshift Sunucusuz, veri ambarı kapasitesini otomatik olarak tedarik edip ölçeklendirerek zorlu ve öngörülemez iş yükleri için yüksek performans üretir ve siz sadece kullandığınız kaynaklar karşılığında ücret ödersiniz.

S: Müşterilerin Amazon Redshift'i seçmelerinin başlıca nedenleri nelerdir?

Binlerce müşteri öngörülere ulaşma sürelerini hızlandırmak amacıyla Amazon Redshift'i kullanımı kolay olduğu, her ölçekte performans sunduğu ve tüm verileri analiz etmeye olanak tanıdığı için seçiyor. Tam olarak yönetilen bir hizmet olan Amazon Redshift, sunduğu tedarik edilen ve sunucusuz seçenekleriyle veri ambarınızı yönetmek zorunda kalmadan analiz çalıştırma ve ölçeklendirmeyi sizin adınıza kolaylaştırır. Tahmin edilebilir iş yükleri için tedarik edilen seçeneğini kullanabilir veya veri ambarı kapasitesini otomatik olarak tedarik edip ölçeklendirerek zorlu ve öngörülemez iş yükleri için yüksek performans sunmak üzere Amazon Redshift Sunucusuz seçeneğini tercih edebilirsiniz. Kullanmaya başladığınız andan itibaren diğer bulut veri ambarlarına göre 3 kata kadar daha iyi bir fiyat performansıyla her ölçekte performans sunarak maliyetlerinizi öngörebilmenize yardımcı olur. Amazon Redshift; operasyonel veritabanlarınız, data lake'iniz, veri ambarınız ve binlerce üçüncü taraf veri kümesi genelindeki tüm verileriniz ile ilgili gerçek zamanlı ve tahmine dayalı analizler çalıştırarak öngörüler elde etmenize olanak tanır. Amazon Redshift, verilerinizi gerek bekleme durumunda gerekse taşınma sırasında güvende tutar ve hem dahili hem de harici uygunluk gerekliliklerini karşılar. Sektör lideri güvenliği desteklemesi sayesinde verilerinizi hem taşınma sırasında hem de bekleme durumundayken korur ve SOC1, SOC2, SOC3 ile PCI DSS Seviye 1 gereklilikleriyle uyumludur. Tüm Redshift güvenlik ve uygunluk özellikleri hiçbir ek ücret olmadan dahildir.

S: Amazon Redshift, veri ambarı yönetimini nasıl basitleştirir?

Amazon Redshift, AWS tarafından tam olarak yönetildiği için donanım tedarik etme, yazılım düzeltme eki uygulama, kurulum, yapılandırma, düğüm ve sürücüleri izleyerek hatalardan kurtarma veya yedekleme gibi veri ambarı yönetimi görevleri ile ilgili olarak artık endişelenmenize gerek yoktur. AWS, bir veri ambarını kurmak, işletmek ve ölçeklendirmek için gereken işleri sizin adınıza yöneterek zaman tasarrufu yapmanızı ve uygulamalarınızı geliştirmeye odaklanmanızı sağlar. Otomatik iyileştirme özellikleri de bulunan Amazon Redshift, bunun yanı sıra Redshift Advisor'da ambarınızın yönetimine ilişkin önerilerde bulunur. Amazon Redshift, Redshift Spectrum için bilgi işlem altyapısı, yük dengeleme, planlama ve zamanlamanın yanı sıra Amazon S3'te depolanan verilere yönelik sorgularınızı yürütme süreçlerinin tümünü yönetir. Sunucusuz seçeneği, veri ambarı kapasitesini otomatik olarak tedarik edip ölçeklendirerek zorlu ve öngörülemez iş yükleri için yüksek performans sunar ve siz sadece kullandığınız kaynaklar karşılığında ücret ödersiniz.

S: Amazon Redshift'in performansı, diğer veri ambarlarının performansına kıyasla nasıldır?

TPC-DS karşılaştırmalı değerlendirme sonuçlarına göre Amazon Redshift, kullanılmaya başlandığı andan itibaren nispeten küçük 3 TB'lık bir veri kümesi için bile en iyi fiyat performansını sunar. Amazon Redshift, diğer bulut veri ambarlarına kıyasla 3 kata kadar daha iyi fiyat performansı sunar. Bu, Amazon Redshift'in lider fiyat performansından manuel ayar yapmak zorunda kalmadan başlangıçtan itibaren fayda sağlayabileceğiniz anlamına gelir. Diğer bulut veri ambarlarına kıyasla Amazon Redshift ile 3 kata kadar daha iyi fiyat performansına sahip olun | AWS Büyük Veri Blogu.

Amazon Redshift, yüzlerce düğüme doğrusal olarak ölçeklendirme yapan büyük ölçüde paralel işleme (MPP) işlem kümelerine sahip, verimli, okuma için optimize edilmiş, sütunlu, sıkıştırılmış veri depolaması da dahil olmak üzere veri ambarı ve analiz iş yüklerine yönelik geleneksel veritabanlarına kıyasla 10 kata kadar daha iyi performans sunmak için çeşitli inovasyonlardan faydalanır. Amazon Redshift, verileri bir dizi satır şeklinde depolamak yerine sütunlar halinde düzenler. Boş bir tabloya veri yüklenirken Amazon Redshift, otomatik olarak verilerinizden örnek toplar ve en uygun sıkıştırma şemasını seçer.

Redshift Spectrum, Amazon S3'te eksabaytlarca veri üzerinde sorgu çalıştırmanıza olanak tanır. Hiçbir yükleme veya ayıklama, dönüştürme ve yükleme (ETL) gerekli değildir. Verilerinizin hiçbirini Amazon Redshift'te depolamasanız bile Redshift Spectrum'u kullanarak Amazon S3'te depolanan 1 eksabayta kadar boyuta sahip veri kümelerini sorgulayabilirsiniz. Gerçekleştirilmiş görünümler; panolar, iş zekası (BI) araçlarının sorguları ve ETL verilerini işleme gibi tekrarlanan ve tahmin edilebilir analiz iş yükleri için çok daha hızlı sorgu performansı elde etmenize imkan tanır. Gerçekleştirilmiş görünümleri kullanarak önceden işlenmiş sorgu sonuçlarını saklayabilir ve kaynak tablolarında yapılan en son değişiklikleri aşamalı olarak işleyerek bunları verimli bir şekilde koruyabilirsiniz. Bu noktadan sonra gerçekleştirilmiş görünümlere başvuran sorgular, daha önce hesaplanmış olan sonuçları kullanacağından çok daha hızlı yürütülür. Bunun yanı sıra otomatik yenileme ve sorguyu yeniden yazma özelliklerinin kullanımı, gerçekleştirilmiş görünümlerin kullanımını basitleştirir ve otomatikleştirir.

Şirket içi veri ambarlarının işlem ve depolama kapasitesi, şirket içi donanımın kısıtlamaları ile sınırlıdır. Amazon Redshift, değişen iş yükü gereksinimlerini karşılamak için işlem ve depolamayı gerektiğinde bağımsız biçimde ölçeklendirebilmenizi sağlar. Redshift Yönetilen Depolama (RMS) sayesinde artık Amazon S3 depolamasını kullanarak depolamanızı petabaytlara ölçeklendirme olanağına sahipsiniz.

Otomatik Tablo Optimizasyonu (ATO), manuel çaba göstermeden en uygun sıralama ve dağıtım anahtarları oluşturmanın performans avantajlarından yararlanmanıza yardımcı olan bir kendi kendini iyileştirme özelliğidir. Sorguların tablolarla nasıl etkileşim kurduğunu gözlemleyen ATO, performansı kümenin iş yüküne dayalı olarak optimize edecek en iyi sıralama ve dağıtım anahtarlarını seçmek için makine öğreniminden (ML) yararlanır. ATO optimizasyonlarının, 3 TB ve 30 TB TPC-DS karşılaştırmalı değerlendirmeleri kullanılarak ATO kullanmayan bir kümeye kıyasla küme performansını sırasıyla %24 ve %34 artırdığı görülmüştür. Otomatik Vakum Silme, Otomatik Tablo Sıralama ve Otomatik Analiz gibi ek özellikler de Redshift kümeleri için manuel bakım ve iyileştirme ihtiyacını ortadan kaldırarak hem yeni kümeler hem de üretim iş yükleri için en yüksek performansı sağlar.

İş yükü yönetimi, sorguları bir dizi tanımlı kuyruğa yönlendirerek kümenin eş zamanlılık ve kaynak kullanımını yönetmenize olanak tanır. Günümüzde Amazon Redshift hem otomatik hem de manuel yapılandırma türlerine sahiptir. Manuel WLM yapılandırmalarında, her kuyruğa tahsis edilen bellek miktarını ve her biri söz konusu belleğin bir bölümünü kullanan, kuyruklarının her birinde çalışabilen sorguların maksimum sayısını tanımlamaktan sorumlu olursunuz. Manuel WLM yapılandırmaları, iş yükünüzdeki değişikliklere uyum sağlamaz ve hata yapmamak için sorgularınızın kaynak kullanımı hakkında ayrıntılı bilgiye sahip olmayı gerektirir. Amazon Redshift Otomatik WLM, kuyruklar için bellek kullanımını veya eş zamanlılığı tanımlamanızı gerektirmez. Bunun yerine, eş zamanlılığı dinamik olarak ayarlayarak aktarım hızına göre optimize eder. İsteğe bağlı olarak, iş önceliğiniz temelinde sorgulara tercihe bağlı kaynak tahsisatı sağlamak için sorgu öncelikleri tanımlayabilirsiniz. Otomatik WLM, iş yükünüzü yönetmenize olanak tanıyan güçlü araçlar da sağlar. Sorgu öncelikleri, iş yükleriniz için öncelikler tanımlamanızı mümkün kılarak Amazon Redshift'te yoğun zamanlarda tutarlı sorgu performansı sunmak için daha fazla kaynak sağlamayı da içeren ayrıcalıklı muamele görmelerine olanak tanır ve sorgu izleme kuralları, kaçak veya pahalı sorguların algılanması ve sistem kaynaklarını tüketmesinin önlenmesi gibi beklenmeyen durumları yönetmeye yönelik yöntemler sunar. Otomatik WLM'nin uyarlanabilir eş zamanlılık performans iyileştirmelerine sahip önemli alanları şunlardır: belleğin uygun şekilde tahsis edilmesi, belleğin kuyruklar arasında statik bölümlendirilmesinin ortadan kaldırılması ve aktarım hızında artış.

Kümenizdeki iş yükünü ve kullanım ölçümlerini analiz eden Amazon Redshift Advisor, performansı artırmak ve maliyetleri optimize etmek için özelleştirilmiş önerilerde bulunur. Advisor önerilerini görmek için Amazon Redshift konsolunda oturum açın. Daha fazla bilgi için bkz. Amazon Redshift Advisor'ın önerileriyle çalışma.

S: Amazon Redshift'i kullanmaya nasıl başlarım?

AWS Management Console'da birkaç tıklamayla veri sorgulamaya başlayabilirsiniz. TPC-H, TPC-DS karşılaştırmalı değerlendirme veri kümelerini içeren önceden yüklenmiş örnek veri kümelerinden ve diğer örnek sorgulardan faydalanarak analizleri hemen başlatabilirsiniz. Veritabanları, şemalar, tablolar oluşturabilir ve Amazon S3, Amazon Redshift veri paylaşımlarından veri yükleyebilir veya mevcut bir Amazon Redshift tedarik edilen küme anlık yedeğinden geri yükleyebilirsiniz. Ayrıca, Amazon S3 data lake'inde Parquet veya ORC gibi açık biçimlerde doğrudan veri sorgulayabilir ya da Amazon Aurora, Amazon RDS PostgreSQL ve MySQL gibi operasyonel veritabanlarında veri sorgulayabilirsiniz.

Amazon Redshift Sunucusuz'u kullanmaya başlamak için Try Amazon Redshift Serverless (Amazon Redshift Sunucusuz'u Dene) öğesini seçin ve veri sorgulamaya başlayın. Amazon Redshift Sunucusuz, iş yüklerindeki her türlü artışı karşılamak için otomatik ölçeklendirme yapar.

S: Amazon Redshift için Gelişmiş Sorgu Hızlandırıcı (AQUA) nedir?

Gelişmiş Sorgu Hızlandırıcı (AQUA), belirli sorgu türlerini otomatik olarak hızlandırarak Amazon Redshift sorgularının diğer kurumsal bulut veri ambarlarına kıyasla 10 kata kadar daha hızlı çalışmasını sağlayan, dağıtılmış ve donanım hızlandırmalı yeni bir önbellektir. AQUA; RA3.16xlarge, RA3.4xlarge veya RA3.xlplus düğümleriyle ek bir ücret ve herhangi bir kod değişikliği olmadan sunulmaktadır.

S: Redshift veri ambarım için AQUA'yı nasıl etkinleştiririm/devre dışı bırakırım?

RA3 düğümlerinde çalışan Redshift kümeleri için; Redshift konsolu, AWS Command Line Interface (CLI) ya da API kullanımı ile küme seviyesinde AQUA'yı etkinleştirebilir/devre dışı bırakabilirsiniz. DC, DS ya da daha eski nesil düğümlerde çalışan Redshift kümeleri için, ilk olarak RA3 düğümlerine yükseltme yapmalı ve ardından AQUA'yı etkinleştirmeli/devre dışı bırakmalısınız.

S: AQUA, ne tür sorguları hızlandırır?

AQUA, depolama katmanına daha yakın taramalar, filtreleme ve toplama gibi veri açısından yoğun görevleri gerçekleştirerek analiz sorgularını hızlandırır. En fark edilir performans artışını, özellikle LIKE ve SIMILAR_TO koşullarında olduğu gibi geniş aramalar gerektiren sorgularda göreceksiniz. Zaman geçtikçe, AQUA tarafından hızlandırılan sorgu türleri artacaktır.

S: Redshift kümem üzerindeki hangi sorguların AQUA tarafından hızlandırıldığını nasıl anlarım?

AQUA tarafından hızlandırılan sorguları görmek için sistem tablolarını sorgulayabilirsiniz.

S: Amazon Redshift tarafından yönetilen depolama nedir?

Amazon Redshift tarafından yönetilen depolama, sunucusuz ve RA3 düğüm tipleriyle kullanılabilir ve kümeyi yalnızca işlem gereksinimlerinize göre boyutlandırmak üzere işlem ve depolama alanı için bağımsız olarak ölçeklendirmenize ve ödeme yapmanıza olanak tanır. Amazon Redshift, 1. katman önbellek olarak otomatik şekilde yüksek performanslı SSD tabanlı yerel depolamayı kullanır ve herhangi bir işlem yapmadan otomatik olarak Amazon S3'e ölçeklendirirken yüksek performans sağlamak için veri bloğu sıcaklığı, veri bloğu yaşı ve iş yükü düzenleri gibi optimizasyonlardan yararlanır.

S: Amazon Redshift'in yönetilen depolamasını nasıl kullanırım?

Amazon Redshift Yoğun Depolama veya Yoğun İşlem düğümlerini zaten kullanıyorsanız Esnek Yeniden Boyutlandırma'yı kullanarak mevcut kümelerinizi yeni işlem bulut sunucusu RA3'e yükseltebilirsiniz. RA3 bulut sunucusunu kullanan Amazon Redshift Sunucusuz ve kümeler, Redshift tarafından yönetilen depolamayı otomatik olarak kullanarak veri depolar. Bu özelliği kullanabilmek için Amazon Redshift Sunucusuz veya RA3 bulut sunucularını kullanmanın dışında başka bir eylem gerekmez.

S: Amazon Redshift Spectrum nedir?

Amazon Redshift Spectrum, Amazon Redshift'in Amazon S3'teki data lake'inizde veri yükleme veya ETL gereksinimi olmadan sorgu çalıştırmanıza olanak tanıyan bir özelliğidir. Bir SQL sorgusu gönderdiğinizde, bir sorgu planı oluşturup bunu iyileştiren Amazon Redshift uç noktasına gider. Amazon Redshift, yerel ortamda ve Amazon S3'te bulunan verileri belirler, okunması gereken S3 verilerini en düşük miktara indirmek üzere bir plan oluşturur ve Amazon Redshift Spectrum çalışanlarının paylaşılan bir kaynak havuzu üzerinden S3'teki verileri okuyup işlemelerini talep eder.

S: RA3 bulut sunucularını kullanmayı ne zaman düşünmeliyim?

Aşağıdaki durumlarda RA3 düğüm türlerini kullanmayı göz önünde bulundurun:

  • İşlem için depolamadan ayrı olarak ölçeklendirme ve ödeme yapma esnekliğine sahip olmanız gerektiğinde.
  • Toplam verilerinizin bir bölümünü sorguladığınızda.
  • Veri hacminiz hızla arttığında veya hızla artması beklendiğinde.
  • Kümeyi sadece performans ihtiyaçlarınıza göre boyutlandırma esnekliğine sahip olmak istediğinizde.

Verilerin ölçeği büyümeye devam edip petabaytlara ulaştığında, Amazon Redshift veri ambarınıza aldığınız veri miktarı da büyür. Verilerinizin tümünü uygun maliyetli bir biçimde analiz etmenin yollarını aramaya başlayabilirsiniz.

Yönetilen depolamaya sahip yeni Amazon Redshift RA3 bulut sunucuları sayesinde düğüm sayısını performans gereksinimlerinize göre seçebilir ve yalnızca kullandığınız yönetilen depolama için ödeme yaparsınız. Bu, size RA3 kümenizi depolama maliyetlerinizi artırmadan günlük olarak işlediğiniz veri miktarına göre boyutlandırma esnekliği sunar. AWS Nitro System üzerinde geliştirilen yönetilen depolamaya sahip RA3 bulut sunucuları, sık erişilen verileriniz için yüksek performanslı SSD'leri ve nadir erişilen verileriniz için Amazon S3'ü kullanarak kullanım kolaylığı, uygun maliyetli depolama ve hızlı sorgu performansı sağlar.

S: Hangi durumlarda Amazon RDS yerine Amazon Redshift kullanmalıyım?

Hem Amazon Redshift hem de Amazon Relational Database Service (RDS), veritabanı yönetim yükünü devrederken bulutta geleneksel ilişkisel veritabanları çalıştırmanıza olanak tanır. Müşteriler Amazon RDS veritabanlarını öncelikli olarak çevrimiçi işlem gerçekleştirme (OLTP) iş yükleri için, Amazon Redshift'i ise en çok raporlama ve analiz için kullanıyorlar. OLTP iş yükleri, belirli bilgilerin hızlı bir şekilde sorgulanmasını gerektirir ve ekleme, güncelleme ve silme gibi işlemler için verilen destek en iyi şekilde Amazon RDS tarafından işlenir. Amazon Redshift, birden çok düğümün ölçeğinden ve kaynaklarından yararlanmasının yanı sıra çeşitli optimizasyonlar kullanarak çok büyük veri kümeleri üzerinde analiz ve raporlama iş yükleri için geleneksel veritabanlarına kıyasla performansı bir üst düzeye taşır. Amazon Redshift, verilerinizin boyutu ve sorgularınızın karmaşıklığı arttıkça ya da raporlama ve analiz işlemlerinizin OLTP iş yükünüzün performansını etkilemesini engellemek amacıyla ölçek genişletmek için harika bir seçenek sunar. Artık yeni Birleşik Sorgu özelliği sayesinde, Amazon RDS’iniz veya Aurora veritabanı hizmetlerinizde Amazon Redshift’le kolayca veri sorgulaması yapabilirsiniz.

S: Hangi durumlarda Amazon EMR yerine Amazon Redshift veya Redshift Spectrum kullanmalıyım?

Apache Spark, Hadoop, Presto veya Hbase gibi büyük veri işleme framework’leriyle son derece büyük veri kümelerini işlemek ve analiz etmek için özel kod kullanıyorsanız Amazon EMR’yi kullanmalısınız. Amazon EMR, kümelerinizin yapılandırılması ve kümelerinize yüklediğiniz yazılımlar konusunda tam denetime sahip olmanızı sağlar.

Amazon Redshift gibi veri ambarları, tamamen farklı türde bir analiz için tasarlanmıştır. Veri ambarlarının tasarım amacı, envanter, finans ve perakende satış sistemleri gibi birçok farklı kaynaktan alınan verilerin bir araya toplanmasıdır. Şirket genelinde raporlamanın tutarlı bir şekilde doğru olmasının sağlanması için veri ambarları, verileri yüksek oranda yapılandırılmış bir şekilde depolar. Bu yapı, doğrudan veritabanı tablolarında yerleşik olarak veri tutarlılığı kuralları uygulanmasını sağlar. Amazon Redshift, devasa büyüklükteki yapılandırılmış ve yarı yapılandırılmış veri koleksiyonları üzerinde karmaşık sorgular gerçekleştirmenizi ve son derece hızlı performansa sahip olmanızı gerektiren durumlarda kullanılacak en iyi hizmettir.

Amazon Redshift ve S3’teki veriler üzerinde sorgu çalıştırmak için Redshift Spectrum özelliği harika bir seçenek olsa da genellikle kurumların Amazon EMR gibi işleme framework’lerinden beklediği kullanım örnekleri için pek uygun değildir. Amazon EMR, SQL sorguları çalıştırmanın çok daha ötesine gider. Amazon EMR, tam olarak özelleştirilebilir kümelerde Spark, Hadoop ve Presto gibi popüler büyük veri işleme framework’lerinin en son sürümlerini kullanarak son derece büyük veri kümelerini işlemenize ve analiz etmenize olanak tanıyan, yönetilen bir hizmettir. Amazon EMR ile makine öğrenimi, grafik analizi, veri dönüşümü, veri akışı gibi uygulamalar ve kodunu yazabileceğiniz neredeyse her şey için birçok farklı çeşit ölçeği genişletilebilir veri işleme görevi çalıştırabilirsiniz.

Redshift Spectrum’u EMR ile birlikte kullanabilirsiniz. Redshift Spectrum, tablo tanımlarını depolamak için Amazon EMR ile aynı yaklaşımı kullanır. Redshift Spectrum, verileri ve tablo tanımlarını bulmak için Amazon EMR tarafından kullanılan Apache Hive Metastore’u destekleyebilir. Amazon EMR hizmetini kullanıyorsanız ve zaten bir Hive Metastore’unuz varsa tek yapmanız gereken, Amazon Redshift kümenizi bunu kullanacak şekilde yapılandırmaktır. Daha sonra Amazon EMR i̇şlerinizin yanı sıra bu verileri doğrudan sorgulamaya başlayabilirsiniz. Bundan dolayı, büyük bir veri deposunu kullanmak için zaten EMR hizmetini kullanıyorsanız Redshift Spectrum’u tam olarak bununla aynı anda, Amazon EMR işlerinize engel olmaksızın kullanarak verileri sorgulayabilirsiniz.

Sorgu hizmetleri, veri ambarları ve karmaşık veri işleme framework’leri birbirinden farklıdır ve farklı amaçlar için kullanılır. İş için doğru aracı seçmeniz yeterli.

S: Hangi durumlarda Amazon Redshift Spectrum yerine Amazon Athena'yı kullanmalıyım?

Amazon Athena, Amazon S3'te standart SQL kullanarak veri analizi yapmanızı kolaylaştıran etkileşimli bir sorgu sistemidir. Athena'nın kullanımı kolaydır. S3'teki verilerinize yönlendirin, şemayı tanımlayın ve standart SQL kullanarak sorgulamaya başlayın.

Redshift Spectrum, Amazon Redshift'in bir özelliğidir. Sık erişilen verileri en yüksek performansla ve katı bir Hizmet Düzeyi Sözleşmesi (SLA) kapsamında analiz etmeniz gerekiyorsa Amazon Redshift'i kullanmalısınız. Redshift Spectrum'u kullanarak Amazon Redshift sorgularınızın, Amazon S3 data lake'inizde daha nadir erişilen verilere ulaşmasını sağlayabilirsiniz. Böylece, verilerinizi dilediğiniz yerde ve biçimde, ihtiyaç duyduğunuz anda işlemeye hazır bir şekilde depolama özgürlüğünüz olur.

S: Amazon EC2'de kendi MPP veri ambarı kümemi çalıştırmak yerine neden Amazon Redshift'i kullanmalıyım?

Amazon Redshift, aşağıdakiler dahil olmak üzere kendi veri ambarınızı yönetmenin getirdiği, zaman alan birçok görevi otomatik olarak yerine getirir:
  • Kurulum: Amazon Redshift ile verilerinizi yükleyip sorgulamaya başlamak için tek yapmanız gereken bir veri ambarı kümesi oluşturma ve şemanızı tanımlamaktır. Sağlama, yapılandırma veya yamalamayı yönetmeniz gerekmez.
  • Veri Dayanıklılığı: Amazon Redshift, verilerinizi veri ambarı kümenizin içinde çoğaltır ve on bir dokuzluk dayanıklılık sağlayacak şekilde tasarlanmış Amazon S3’e sürekli olarak yedekler. Amazon Redshift, her bir sürücüde yer alan verileri kümenizdeki diğer düğümlere yansıtır. Bir sürücü başarısız olursa sorgularınız, Redshift’in replikalardan sürücünüzü yeniden oluşturması sırasında oluşan küçük bir gecikme süresi artışıyla da olsa devam eder. Düğüm hatası söz konusu olduğunda, Amazon Redshift otomatik olarak yeni düğüm tedarik eder ve kümenin içindeki diğer düğümlerden ya da Amazon S3’ten verileri geri yüklemeye başlar. En sık yürütülen sorgularınızın hızla çalışır hale gelmesi için en sık sorguladığınız verilerin geri yüklenmesine öncelik verir.
  • Ölçeklendirme: Kapasite ve performans gereksinimleriniz değiştikçe Amazon Redshift veri ambarı kümenizde tek bir API çağrısıyla veya AWS Management Console'da birkaç tıklamayla düğüm ekleyip kaldırabilirsiniz. Ayrıca Amazon Redshift'teki zamanlayıcı özelliğini kullanarak ölçeklendirme ve yeniden boyutlandırma operasyonlarınızı planlayabilirsiniz.
  • Otomatik Güncelleştirme ve Düzeltme Eki Uygulama: Amazon Redshift, yükseltmeleri ve düzeltme eklerini otomatik bir biçimde veri ambarınıza uygulayarak uygulamanızın yönetimine değil, kendisine odaklanmanızı mümkün kılar.
  • Eksabayt Ölçeğinde Sorgu Olanağı: Amazon Redshift Spectrum, Amazon S3'teki eksabaytlarca veri üzerinde sorgu çalıştırmanızı sağlar. Yükleme veya ETL gerekmez. Verilerinizin hiçbirini Amazon Redshift'te depolamasanız bile Redshift Spectrum'u kullanarak Amazon S3'te depolanan 1 eksabayta kadar boyutlu veri kümelerini sorgulayabilirsiniz.

S: Bir Amazon Redshift veri ambarı kümesi oluşturup buna nasıl erişebilirim?

AWS Management Console'u ya da Amazon Redshift API'lerini kullanarak kolayca bir Amazon Redshift veri ambarı kümesi oluşturabilirsiniz. Tek düğümlü, 160 GB boyutlu bir veri ambarıyla kullanmaya başlayabilir ve AWS Console'da birkaç tıklamayla ya da tek bir API çağrısıyla ölçeği petabayt seviyesi veya bunun da üzerine çıkarabilirsiniz.

Değerlendirme veya geliştirme/test iş yükleri için en uygun seçenek olan tek düğümlü yapılandırma, Amazon Redshift'i hızla ve uygun maliyetli bir şekilde kullanmaya başlayıp gereksinimleriniz büyüdükçe ölçeği çok düğümlü bir yapılandırmaya büyütmenize olanak tanır. Bir Redshift veri ambarı kümesi, düğüm türüne bağlı olarak 1 ila 128 işlem düğümü içerebilir. En yeni nesil düğüm türü olan RA3 için minimum düğüm sayısı ikidir. Ayrıntılar için belgelere bakın.

Çok düğümlü yapılandırma, istemci bağlantılarını yöneten ve sorguları alan bir ana düğümün yanı sıra verileri depolayıp sorguları ve hesaplamaları gerçekleştiren iki işlem düğümü gerektirir. İşlem düğümü ile aynı boyuta sahip ana düğüm sizin adınıza otomatik olarak tedarik edilir ve bunun için ücret ödemezsiniz.

Tek yapmanız gereken, tercih ettiğiniz Erişilebilirlik Alanı'nı (isteğe bağlı), düğüm sayısını, düğüm türlerini, bir birincil ad ve parolayı, güvenlik gruplarını, yedek tutma tercihlerinizi ve diğer sistem ayarlarını belirtmektir. İstediğiniz yapılandırmayı seçtiğinizde, Amazon Redshift gerekli kaynakları tedarik eder ve veri ambarı kümenizin kurulumunu yapar.

Veri ambarı kümeniz erişilebilir hale geldiğinde AWS Management Console'dan ya da Redshift API'lerini kullanarak kümenin uç noktasını, JDBC ve ODBC bağlantı dizesini alabilirsiniz. Daha sonra bu bağlantı dizesini en sevdiğiniz veritabanı aracı, programlama dili veya İş Zekası (BI) aracıyla kullanabilirsiniz. Çalışmakta olan veri ambarı kümenize yönelik ağ isteklerini yetkilendirmeniz gerekir. Ayrıntılı bir açıklama için lütfen Kullanmaya Başlama Kılavuzumuza başvurun.

S: Amazon Redshift Uzamsal'ı neden kullanmalıyım?

Amazon Redshift Uzamsal, verilerinizle ilgili kapsamlı öngörüler için konum tabanlı analizler sağlar. Uzamsal veriler ile iş verilerini sorunsuz bir biçimde entegre ederek karar verme süreçlerini destekleyen analizler sunar. Amazon Redshift, polimorfik veri türü GEOMETRİSİNE ve çeşitli önemli SQL uzamsal fonksiyonlarına sahip yerel uzamsal veri işleme desteğini 2019'un Kasım ayında kullanıma sundu. Artık COĞRAFYA veri türünü destekliyoruz ve SQL uzamsal fonksiyonlar kitaplığımızın büyüklüğü 80'e ulaştı. Shapefiles, GeoJSON, WKT, WKB, eWKT ve eWKB dahil olmak üzere yaygın uzamsal veri türleri ve standartlarının tümünü destekliyoruz. Daha fazla bilgi edinmek için belgeler sayfasını veya Amazon Redshift uzamsal öğreticisi sayfasını ziyaret edin.

S: Soğuk sorgu performans iyileştirmesi nedir ve Amazon Redshift, soğuk sorgu performansını iyileştirmek için ne yapar?

Amazon Redshift, derlenmesi gereken sorguları 2 kata kadar daha hızlı işleyebilir. Bu iyileştirme, mevcut bir kümedeki yeni bir iş yükü üzerinde veya mevcut bir kümede yazılım güncellemesi gerçekleştirdikten sonra yeni bir Redshift kümesi oluşturduğunuzda size daha iyi sorgu performansı sunar. Bu sorgu performansı iyileştirmeleri hiçbir ilave ücret olmadan sunulur ve bunları kümelerinizde etkinleştirmek için herhangi bir eyleme gerek yoktur.

Soğuk sorgu performansı iyileştirmesi sayesinde sorgu derlemeleri, kümenizin ana düğümüne ait işlem kaynaklarının ötesinde sunucusuz bir derleme hizmetine ölçeklendirilir. Sınırsız önbellek desteği bulunan Amazon Redshift, derlenen nesneleri depolayarak görev açısından kritik sorgularınız Amazon Redshift'e gönderildiğinde önbellek isabet oranını %99,60'tan %99,95'e çıkarır.

Sorgular Amazon Redshift'e gönderildiğinde, sorgu yürütme altyapısı sorguyu makine kodu olarak derler ve küme düğümlerine dağıtır. Derlenen kod, yorumlayıcı kullanma ek yükünü ortadan kaldırdığı için daha hızlı çalışır. Kod önbelleği bulunmayan yeni bir küme için veya mevcut bir küme son sürümüne güncellendikten sonra kod önbelleği temizlenir ve sorguların sorgu derleme sürecinden geçirilmesi gerekir. Bunun sonucu olarak, bir sorgunun gecikme süresi değişiklik gösterebilir ve bu durum, bazı iş yüklerinin gerekliliklerini karşılamayabilir. Bu güncellemeyle sınırsız önbellek, kod derleme ihtiyacını minimum seviyeye indirir ve derleme ihtiyacı söz konusu olduğunda ölçeklenebilir bir derleme grubu, kodu paralel biçimde derleyerek iş yüklerinizin hızını artırır. Hız artışının büyüklüğü, iş yükünün karmaşıklığına ve eş zamanlılığına bağlıdır. Kod derleme hakkında daha fazla bilgi edinmek için Veritabanı geliştirici kılavuzundaki Sorgu İşleme bölümüne bakın.

Sunucusuz

S: Amazon Redshift Sunucusuz (önizleme) nedir?

Amazon Redshift Sunucusuz (önizleme), veri ambarı altyapısını ayarlayıp yönetmeye gerek kalmadan analizleri saniyeler içinde kolayca çalıştırmanızı ve ölçeklendirmenizi sağlayan, Amazon Redshift'in sunucusuz seçeneğidir. Redshift Sunucusuz sayesinde veri analistleri, geliştiriciler, iş uzmanları ve veri bilimciler dahil her kullanıcı, verileri veri ambarına yükleyip sorgulamak suretiyle kolayca öngörüler elde edebilir.

S: Amazon Redshift Sunucusuz'u (önizleme) kullanmaya nasıl başlarım?

AWS Management Console'da sadece birkaç tıklamayla Configure Amazon Redshift Serverless (Amazon Redshift Sunucusuz'u yapılandır) öğesini seçerek veri sorgulamaya başlayabilirsiniz. Hava durumu verileri, nüfus sayımı verileri ve karşılaştırmalı değerlendirme veri kümeleri gibi önceden yüklenen örnek veri kümelerinin yanı sıra örnek sorgulardan da faydalanarak analizleri hemen başlatabilirsiniz. Veritabanları, şemalar, tablolar oluşturabilir ve Amazon S3, Amazon Redshift veri paylaşımlarından veri yükleyebilir veya mevcut bir Redshift tedarik edilen küme anlık yedeğinden geri yükleyebilirsiniz. Ayrıca, Amazon S3 data lake'inde (Parquet veya ORC gibi) açık biçimlerde doğrudan veri sorgulayabilir ya da Amazon Aurora, Amazon RDS PostgreSQL ve MySQL gibi operasyonel veritabanlarında veri sorgulayabilirsiniz.

S: Amazon Redshift Sunucusuz (önizleme) ne gibi olanaklar sunuyor?

Amazon Redshift Sunucusuz, aşağıdakileri de içeren çok sayıda avantaj sunar:

  • Kümeleri tedarik etmeye veya yönetmeye gerek kalmadan hızla öngörü edinme olanağı.
  • Aşırı kaynak tedarik etmek zorunda kalmadan iş yükü taleplerine dayalı olarak akıllı ve otomatik ölçeklendirme.
  • Ölçeklendirme ve sürüm güncellemeleri için sürekli hizmet kullanılabilirliği.
  • Hem Amazon S3 data lake'inde açık biçimlerde veri ambarına yüklenen veriler hem de operasyonel veritabanlarındaki veriler için veritabanı ayarlamaya gerek olmadan hızlı ve hemen kullanılabilir sorgu performansı.
  • Zengin SQL analizleri, dayanıklılık ve Amazon Redshift'in işlem garantileri.
  • Sadece kullanılan kapasite karşılığında ödeme yapmanın sunduğu maliyet verimliliği ve daha az veri ambarı karmaşıklığı.

S: Amazon Redshift Sunucusuz'u (önizleme) kullanmanın avantajları nelerdir?

Veri ambarı yönetimi konusunda deneyime sahip değilseniz kümeleri kurma, yapılandırma, yönetme veya ambarı ayarlama konusunda endişelenmenize gerek yoktur. Verilerinizden anlamlı öngörüler oluşturmaya veya veriler aracılığıyla temel iş sonuçlarınıza ulaşmaya odaklanabilirsiniz. Sadece kullandığınız kadar ödeyerek maliyetleri yönetilebilir seviyede tutarsınız. Amazon Redshift'in üst düzey performansından, zengin SQL özelliklerinden, data lake'ler ve operasyonel veri ambarları ile sorunsuz entegrasyonundan, yerleşik tahmine dayalı analiz ve veri paylaşımı özelliklerinden faydalanmaya devam edersiniz. Veri ambarınız üzerinde ayrıntılı denetime sahip olmanız gerekiyorsa Redshift kümeleri tedarik edebilirsiniz.

S: Amazon Redshift Sunucusuz (önizleme) diğer AWS hizmetleriyle nasıl çalışır?

Amazon Redshift'in karmaşık birleştirmeler, Amazon S3 data lake ve operasyonel veritabanlarında doğrudan veri sorguları, gerçekleştirilmiş görünümler, depolanmış prosedürler, yarı yapılandırılmış veri desteği ve makine öğrenimi gibi tüm zengin analiz fonksiyonlarını ve uygun ölçekte yüksek performansını kullanmaya devam edebilirsiniz. Amazon Redshift'in entegre olduğu tüm ilişkili hizmetler (Amazon Kinesis, AWS Lambda, Amazon QuickSight, Amazon SageMaker, Amazon EMR, AWS Lake Formation ve AWS Glue gibi), Amazon Redshift Sunucusuz ile çalışmaya devam etmektedir.

S: Amazon Redshift Sunucusuz (önizleme) ile hangi kullanım örneklerini işleyebilirim?

Tüm analiz kullanım örneklerini çalıştırmaya devam edebilirsiniz. Basit bir kullanmaya başlama iş akışı, otomatik ölçeklendirme ve kullandığın kadar ödeme özelliği sayesinde Amazon Redshift Sunucusuz deneyimi, artık hızla kullanılmaya başlanması gereken geliştirme ve test ortamlarını, geçici iş analizlerini, değişkenlik gösteren ve öngörülemez işlem gereksinimlerini ve aralıklı ya da düzensiz iş yüklerini çalıştırmayı daha da kolay ve uygun maliyetli hale getirmektedir.

S: Amazon Athena, Amazon Redshift Sunucusuz'dan hangi açılardan farklıdır?

Hem Amazon Athena hem de Amazon Redshift, sunucusuz olsa da farklı gereksinimlere ve kullanım örneklerine yöneliktir. Her ölçekte yüksek performans gerektiren karmaşık BI ve analiz iş yükleri için en iyi fiyat performansına ihtiyacınız varsa Amazon Redshift gibi bir veri ambarı en iyi seçenektir. Amazon Redshift, Amazon S3'te depolanan verileri sorgulama ve veri ambarında depolanan verilerle birleştirme olanağı da sunar. Athena ise, veri alma ve biçimlendirme konusunda endişelenmeye gerek kalmadan her veri deposunda etkileşimli analiz yapmak açısından daha uygundur. Athena analizi, depolamadan ayrıştırılmış olduğundan size Spark, Flink ve Kafka gibi diğer araç ve hizmetleri kullanarak Athena tarafından analiz edilen veriler üzerinde analizi ve veri işlemeyi daha da zenginleştirme esnekliği sunar.

Veri paylaşımı

S: Amazon Redshift veri paylaşımı nedir?

Amazon Redshift veri paylaşımı, Amazon Redshift'te gerçek zamanlı veri paylaşımı yaparak data lake'i kullanan AWS hesapları ve AWS analiz hizmetleri dahilinde ve genelinde diğer Redshift kümeleriyle okuma amaçları doğrultusunda güvenli ve kolay bir biçimde veri paylaşımı yapmanıza olanak tanır. Veri paylaşımı sayesinde erişim izinlerine sahip oldukları sürece veri kopyalama ve veri hareketi ile ilişkili karmaşıklık ve gecikmeler olmadan tüm Redshift kümelerinden anında gerçek zamanlı veri sorgulaması yapabilirsiniz. Amazon Redshift; kuruluş, hesaplar ve hatta Bölgeler genelinde gerçek zamanlı veri paylaşımı ve sorgulaması yapmanızı mümkün kılar.

S: Veri paylaşımının kullanım örnekleri nelerdir?

Başlıca kullanım örnekleri şunlardır:

  • Çok sayıda BI/analiz kümesiyle veri paylaşımı yaparak okuma iş yükü yalıtımı ve isteğe bağlı ücretlendirme olanağı sağlayan bir merkezi ETL kümesi.
  • Harici tüketicilerle veri paylaşımı yapan bir veri sağlayıcısı.
  • Müşteriler, ürünler gibi ortak veri kümelerini farklı iş grupları genelinde paylaşma ve geniş analiz ile veri bilimi için iş birliği yapma.
  • Bir veri ambarını merkeziyetsizleştirerek yönetimi basitleştirme.
  • Geliştirme, test ve üretim ortamları arasında veri paylaşımı yapma.
  • Redshift verilerine diğer AWS analiz hizmetlerinden erişme.

S: Amazon Redshift'te veritabanları arası sorgu nedir?

Veritabanları arası sorgular sayesinde hangi veritabanına bağlı olduğunuz fark etmeksizin, erişim sahibi olduğunuz herhangi bir Redshift veritabanını kolayca sorgulayabilir ve aldığınız verileri birleştirebilirsiniz. Hem kümede yerel olarak bulunan veritabanları hem de uzak kümelerden erişime açılmış paylaşılan veri kümeleri buna dahil olabilir. Veritabanları arası sorgular size çok kiracılı yapılandırmaları desteklemek üzere verileri ayrı veritabanlarında organize etme esnekliği sunar.

S: Amazon Redshift için AWS Data Exchange nedir?

Amazon Redshift için AWS Data Exchange, AWS Data Exchange içinde bir Redshift veri ambarında dakikalar içinde sorgulayabileceğiniz üçüncü taraf verileri bulup bu verilere abone olmanıza olanak tanır. Ayrıca, verilerinizi AWS Data Exchange aracılığıyla Amazon Redshift'te kolayca lisanslayabilirsiniz. Erişim, bir müşteri verilerinize abone olduğunda otomatik olarak verilir ve müşterinin aboneliği sona erdiğinde otomatik olarak geri alınır, faturalar otomatik olarak oluşturulur ve ödemeler AWS aracılığıyla otomatik olarak tahsil edilip ödenir. Bu özellik, üçüncü taraf verilerini hızlı bir biçimde sorgulayıp analiz etmenize ve bu verilerle uygulama geliştirmenize olanak tanır.

S: AWS Data Exchange'in birincil kullanıcıları kimlerdir?

AWS Data Exchange, AWS müşterilerinin AWS'de üçüncü taraf verilerini güvenli bir şekilde değiş tokuş etmelerini ve kullanmalarını kolaylaştırır. Veri analistleri, ürün müdürleri, portföy yöneticileri, veri bilimcileri, kantitatif analistler, klinik deneme teknisyenleri ve neredeyse her sektörden geliştiriciler analiz geliştirmek, makine öğrenimi modellerini eğitmek ve veriye dayalı kararlar almak amacıyla daha fazla veriye erişmek istemektedir. Ancak, çok sayıda sağlayıcıdan gelen verileri bir arada bulabileceğiniz tek bir adres ve sağlayıcıların verileri ulaştırma şeklinde tutarlılık olmadığı için bu kişiler gönderilen fiziksel ortam, FTP kimlik bilgileri ve ısmarlama API çağrılarının bir karışımı ile uğraşmak zorunda kalır. Buna karşılık, çok sayıda kuruluş verilerini araştırma amaçları veya ticari amaçlar doğrultusunda kullanıma açmak istemektedir ancak veri dağıtım, yetkilendirme ve faturalandırma teknolojisini geliştirip devamlılığını sağlamak hem oldukça zor hem de pahalıdır ve bu durum değerli verilerin arzını baskılamaktadır.

S: AWS Data Exchange hangi AWS Bölgelerinde kullanılabilir?

AWS Data Exchange, sağlayıcılar tarafından sunulan tek ve küresel ölçekte erişilebilir bir ürün kataloğuna sahiptir. Hangi Bölgeyi kullanıyor olursanız olun, aynı kataloğu görebilirsiniz. Ürünün arka planındaki kaynaklar (veri kümeleri, revizyonlar ve varlıklar), programlama yoluyla veya belirli AWS Bölgelerinde AWS Data Exchange konsolu aracılığıyla yönettiğiniz bölgesel kaynaklardır. AWS Data Exchange'in şu anda erişilebilir olduğu AWS Bölgelerinin listesini görmek için AWS Bölgesel Erişilebilirlik Tablosuna bakın.

S: AWS Data Exchange ile Registry of Open Data on AWS arasındaki fark nedir?

AWS Data Exchange ile Registry of Open Data on AWS arasında beş önemli fark vardır:

  • Birinci fark; AWS Data Exchange, geçerli tüm ticari ücretler AWS faturanıza uygulanmış olarak hem ücretsiz hem de ticari veri ürünlerini destekler. Registry of Open Data on AWS ise size düzenlenmiş bir ücretsiz ve açık veri kümeleri listesine erişim hakkı verir. 
  • İkinci fark; AWS Data Exchange, veri sağlayıcısının ürününü yayınlarken belirlediği koşulları özetleyen Veri Aboneliği Sözleşmesi'ni açıkça kabul etmenizi şart koşar. Registry of Open Data on AWS'deki veriler kullanım koşullarına tabi değildir. 
  • Üçüncü fark; AWS Data Exchange'ten istediğiniz Amazon S3 konumuna veri kopyalamak için AWS Data Exchange API'sini kullanmanız gerekir. Registry of Open Data on AWS veri kümelerine S3 API'leri aracılığıyla erişilir. 
  • Dördüncü fark; AWS Data Exchange, veri sağlayıcılarına abonelik etkinliklerini ayrıntılı bir şekilde gösteren günlük, haftalık ve aylık raporlara erişim hakkı tanır. Registry of Open Data on AWS kullanan veri sağlayıcılarının ise veri kullanımını takip etmek için kendi günlüklerini analiz etmeleri gerekir. 
  • Son fark ise, uygun müşterilerin AWS Data Exchange'te veri sağlayıcısı olabilmeleri için AWS Marketplace'e veri sağlayıcısı olarak kaydolup hem ücretsiz hem de ticari ürünleri listelemeye hak kazanmaları gerekir. Bununla birlikte, dileyen her müşteri GitHub aracılığıyla Registry of Open Data on AWS'ye ücretsiz veri ekleyebilir ve AWS'nin belirli açık veri kümeleri için depolama ve bant genişliği maliyetlerine sponsor olması amacıyla AWS Public Dataset Program'a başvurabilir.

S: Amazon Redshift Sorgu Düzenleyicisi v2 nedir?

Amazon Redshift Sorgu Düzenleyicisi v2, Redshift veri ambarınızda sorgular yazıp çalıştırmak için kullanabileceğiniz web tabanlı bir SQL istemci uygulamasıdır. Sorgu sonuçlarını grafiklerle görselleştirebilir ve sorguları ekip üyelerinizle paylaşarak iş birliği yapabilirsiniz. Sorgu Düzenleyicisi v2, birden fazla sayıda veritabanına göz atma ve bu veritabanlarını keşfetme, harici tablolar, görünümler, depolanmış prosedürler ve kullanıcı tanımlı fonksiyonlar gibi çok sayıda özellik sunar. Şema, tablo ve kullanıcı tanımlı fonksiyonlar oluşturmaya yönelik sihirbazlar barındırır. Bir görsel sihirbaz kullanarak Amazon S3'ten Amazon Redshift'e veri de yükleyebilirsiniz. Kaydedilmiş sorguların yönetimini ve bu sorgularda iş birliğini basitleştirir. Ayrıca, sonuçları tek tıklamayla görselleştirerek öngörüleri daha hızlı biçimde elde edebilirsiniz. Veri analistleri, en son önizleme sürümüyle kod/SQL sorguları, ek açıklamalar, sonuçlar ve görselleştirmeler eklemelerine olanak tanıyan Query Doc adlı ortak bir arabirim aracılığıyla sorgu paylaşımı ve iş birliği yapabilirler.

S: Sorgu Düzenleyicisi v2'yi neden kullanmalıyım?

Bir veri analisti, veri bilimcisi veya veri mühendisiyseniz artık Sorgu Düzenleyicisi v2'yi kullanarak şema ve tablolar oluşturup bunlara göz atabilir, veri yükleyebilir ve web tabanlı bir arabirim üzerinden SQL sorguları, depolanmış prosedürler ve UDF'ler yazabilirsiniz. Araçtan çıkmak zorunda kalmadan veriler üzerinde yerinde görsel analiz de gerçekleştirebilirsiniz. Ayrıca, uzun süre çalışan sorgularınızı veya günlük raporlama gibi basit bir raporlama amacına yönelik sorgularınızı planlayabilirsiniz.

S: Sorgu Düzenleyicisi v2'de mevcut özellikler nelerdir?

Sorgu Düzenleyicisi v2 şunları yapmanıza olanak tanır:

  • Görsel olarak şema, tablo oluşturma ve Amazon S3'ten veri yükleme.
  • SQL sorguları yazmaya yönelik sezgisel bir düzenleyici ile sorgular yazın ve öngörüleri daha hızlı elde edin.
  • Sonuçlar üzerinde analiz gerçekleştirme ve sonuçları JSON/CSV biçimlerinde masaüstünüze indirme.
  • Sorguların farklı versiyonlarını otomatik olarak yönetme.
  • Diğer kullanıcılarla iş birliği yaparak sorgu, analiz ve sonuç paylaşımı yapma.
  • Tarayıcı kapalıyken bile arka planda sorgular çalıştırma.

Ölçeklenebilirlik ve eş zamanlılık

S: Amazon Redshift veri ambarı kümemin boyutunu ve performansını nasıl ölçeklendirebilirim?

Sorgu performansını artırmak veya fazla CPU, bellek ya da G/Ç kullanımına yanıt vermek istiyorsanız AWS Management Console veya ModifyCluster API'si aracılığıyla Esnek Yeniden Boyutlandırma'yı kullanarak veri ambarı kümenizdeki düğümlerin sayısını artırabilirsiniz. Veri ambarı kümenizi değiştirdiğinizde istediğiniz değişiklikler anında uygulanır. Redshift veri ambarı kümenize yönelik işlem kullanımı, depolama kullanımı ve okuma/yazma trafiğine ilişkin ölçümlere AWS Management Console veya Amazon CloudWatch API'leri aracılığıyla ücretsiz olarak erişebilirsiniz. Amazon CloudWatch özel ölçüm işlevi aracılığıyla, kullanıcı tarafından tanımlanmış ölçümler de ekleyebilirsiniz.

Eş Zamanlılık Ölçeklendirme özelliği sayesinde neredeyse sınırsız sayıda kullanıcıyı ve eş zamanlı sorguyu, tutarlı şekilde hızlı sorgu performansıyla destekleyebilirsiniz. Eş zamanlılık ölçeklendirme etkinleştirilince, kümenizde sorguların kuyruğa alınmasında artış gözlemlendiğinde Amazon Redshift otomatik olarak küme kapasitesi ekler.

Amazon Redshift Spectrum'da, Amazon S3'te depolanan aynı verilere erişen birden çok Redshift kümesi çalıştırabilirsiniz. Farklı kullanım örnekleri için farklı kümeler kullanabilirsiniz. Örneğin, bir kümeyi standart raporlama için kullanırken başka bir kümeyi veri bilimi sorguları için kullanabilirsiniz. Pazarlama ekibiniz, operasyon ekibinizin kümelerinden farklı olarak kendi kümelerini kullanabilir. Redshift Spectrum, Amazon S3'ten gelen verileri okumak ve işlemek için sorgunuzun yürütülmesini paylaşılan bir kaynak havuzundan birkaç Redshift Spectrum çalışanına otomatik olarak dağıtır ve kalan işlemler için sonuçları tekrar Redshift kümenize çeker.

S: Ölçeklendirme sırasında veri ambarı kümem erişilebilir kalır mı?

Duruma bağlı. Eş Zamanlılık Ölçeklendirme özelliği kullanılırken eş zamanlılık ölçeklendirme esnasında küme, okuma ve yazma için tam olarak erişilebilir durumdadır. Esnek yeniden boyutlandırma ile dört ila sekiz dakika süren yeniden boyutlandırma esnasında küme erişilebilir olmaz. Yönetilen depolamada Redshift RA3 depolama esnekliğiyle, küme tam olarak erişilebilirdir ve veriler, yönetilen depolama ile işlem düğümleri arasında otomatik olarak taşınır.

S: Eş zamanlılık ölçeklendirmeyi ve veri paylaşımını hangi durumlarda kullanmalıyım?

Veri paylaşımı ve eş zamanlılık ölçeklendirme, birbirini tamamlayan özelliklerdir. Eş zamanlılık ölçeklendirme sayesinde Amazon Redshift, tek bir kümedeki bir veya birden fazla iş yükünü otomatik bir şekilde ölçeklendirerek yüksek eş zamanlılığın ve ani sorgu artışlarının altından kalkmanızı sağlar. Amazon Redshift, kullanıcı etkinliğindeki ani artışların üstesinden gelmek için kapasiteyi saniyeler içinde esnek ve otomatik bir biçimde artırır ve etkinlikler azaldığında tekrar düşürür. Uygulamalar, Amazon Redshift ile tek bir uygulama uç noktası kullanarak etkileşim kurmaya devam eder. Veri paylaşımı, çeşitlilik içeren iş yüklerini birden fazla küme ve birden fazla hesap içeren dağıtımlarla ölçeklendirmenize olanak tanır. Bu özellik iş yüklerinin yalıtılmasını ve ücretlendirme olanağını, merkezi olmayan ortamlarda gruplar arası iş birliğini ve hem dahili hem de harici paydaşlara hizmet olarak veri modeliyle hizmet sağlama kabiliyetini mümkün kılar. Eş zamanlılık ölçeklendirmeyi hem veri paylaşımı yapan üretici kümelerinde hem de tüketici kümelerinde etkinleştirebilirsiniz.

S: Amazon Redshift kümemin, eş zamanlılığın yüksek olduğu anlarda bile tutarlı bir şekilde hızlı performans sunacağından emin olmak için kaynaklarımı nasıl yönetmeliyim?

Normal bir veri ambarında eş zamanlı olarak kullanılan sorgu miktarı gün içinde büyük ölçüde değişiklik gösterir. En yüksek talebe göre kaynak sağlamaktansa, yalnızca gerekli aralıklar için kaynak eklemek daha uygun maliyetlidir. Amazon RedShift, bunu sizin için otomatik olarak halleder.

Eş Zamanlılık Ölçeklendirme, binlerce eş zamanlı sorgu söz konusu olduğunda dahi tutarlı olarak hızlı sorgu performansı sunan bir Amazon Redshift özelliğidir. Bu özellik sayesinde Amazon Redshift, gerektiğinde yoğun talebi karşılamak üzere otomatik olarak geçici kapasite ekler. Amazon Redshift otomatik olarak sorguları ölçeklendirme kümelerine yönlendirir. Bu kümeler saniyeler içinde sağlanır ve anında sorguları işlemeye başlar.

Bu özellik çoğu müşteriye ücretsiz olarak sunulur. Tüm Amazon Redshift kümeleri, günde bir saate kadar ücretsiz Eş Zamanlılık Ölçeklendirme kredisi kazanır. Bu sayede, analiz talebinin dalgalandığı dönemlerde bile aylık masraflarınızı öngörebilirsiniz.

S: Esnek Yeniden Boyutlandırma nedir ve Eş Zamanlılık Ölçeklendirme ile arasında ne fark vardır?

Esnek Yeniden Boyutlandırma, tek bir Redshift kümesindeki düğümleri dakikalar içinde ekleyerek veya kaldırarak sorgu performansını yönetir. Örneğin, günün belirli saatlerine veya ay sonu raporlamasına yönelik bir ETL iş yükünün zamanında tamamlanabilmesi için ek Amazon Redshift kaynakları gerekebilir. Eş Zamanlılık Ölçeklendirme, daha fazla küme kaynağı ekleyerek genel sorgu eş zamanlılığını artırır.

S: Eş Zamanlılık Ölçeklendirme kümelerine doğrudan erişebilir miyim?

Hayır. Eş Zamanlılık Ölçeklendirme, Amazon Redshift kaynaklarından oluşan ve çok büyük oranda ölçeklendirilebilen bir havuzdur ve müşteriler buna doğrudan erişemez.

Veri entegrasyonu ve yükleme

S: Amazon Redshift veri ambarıma nasıl veri yükleyebilirim?

Amazon Redshift’e Amazon S3, Amazon RDSAmazon DynamoDB, Amazon EMR, AWS Glue, AWS Data Pipeline gibi çeşitli veri kaynaklarından veya Amazon EC2’deki ya da şirket içindeki başka herhangi bir SSH özellikli konaktan veri yükleyebilirsiniz. Amazon Redshift, veri ambarı kümenize veri alma hızını en üst düzeye çıkarabilmeniz için verilerinizi paralel olarak her işlem düğümüne yüklemeye çalışır. İstemciler ODBC veya JDBC kullanarak Amazon Redshift’e bağlanabilir ve 'insert' SQL komutları çalıştırarak veri ekleyebilir. S3 veya DynamoDB tarafından yöntemler her işlem düğümüne paralel olarak yüklenirken SQL ekleme bildirimlerinin tek bir baş düğüm aracılığıyla yüklenmesi nedeniyle bunun daha yavaş olduğunu lütfen unutmayın. Verileri Amazon Redshift’e yükleme konusunda daha ayrıntılı bilgi edinmek için lütfen Kullanmaya Başlama Kılavuzumuza bakın.

S: Mevcut Amazon RDS, Amazon EMR, Amazon DynamoDB ve Amazon EC2 veri kaynaklarımdan Amazon Redshift’e nasıl veri yükleyebilirim?

COPY komutumuzu kullanarak Amazon EMR, Amazon DynamoDB veya SSH özellikli herhangi bir ana sunucudan doğrudan Amazon Redshift'e paralel olarak veri yükleyebilirsiniz. Amazon Redshift Spectrum, basit bir INSERT INTO komutuyla Amazon S3'ten kümenize veri yüklemenize de olanak tanır. Bu sayede, kümenize Parquet ve ORC gibi farklı biçimlerden veri yükleyebilirsiniz. Bu yaklaşımı kullanmanız durumunda Amazon S3'ten taranan veriler için Redshift Spectrum ücretleri uygulanacağını unutmayın. 

AWS Data Pipeline, Amazon RDS ve Redshift gibi çeşitli AWS veri kaynaklarından veri yüklemeye yönelik yüksek performanslı, güvenilir, hata toleranslı bir çözüm sağlar. AWS Data Pipeline'ı kullanarak veri kaynağını, istenen veri dönüşümlerini belirtebilir, sonra da önceden yazılmış bir içeri aktarma betiği çalıştırarak verilerinizi Amazon Redshift'e yükleyebilirsiniz. AWS Glue aynı zamanda, müşterilerin verilerini analiz için hazırlamalarını ve yüklemelerini kolaylaştıran, tam olarak yönetilen bir ayıklama, dönüştürme ve yükleme (ETL) hizmetidir. AWS Management Console'da birkaç tıklama ile AWS Glue ETL işleri oluşturup bunları çalıştırabilirsiniz. Ayrıca, birçok ETL şirketi, sunduğu araçlarla kullanım konusunda Amazon Redshift'e sertifika vermiştir ve bunların bazıları, verilerinizi yüklemeye başlamanıza yardımcı olmak için ücretsiz denemeler sunar. Bu özelliklerden bazıları, oldukça çeşitli üçüncü taraf kaynaklarından Amazon Redshift'e giden veri işlem hatlarının daha kolay tespit edilip izlenmesi için Redshift konsolu ile daha derin entegrasyonu da uygulamaya koymuştur.

S: Başlangıçta Amazon Redshift'e yüklenmesi gereken çok verim var. İnternet üzerinden aktarmam uzun sürer. Bu verileri nasıl yükleyebilirim?

AWS Snowball'u kullanarak taşınabilir depolama cihazları üzerinden Amazon S3'e veri aktarabilirsiniz. Ayrıca, AWS Direct Connect'i kullanarak ağınız ya da veri merkeziniz ile AWS arasında özel bir ağ bağlantısı kurabilirsiniz. Verilerinizi aktarmak için 1 Gbit/sn veya 10 Gbit/sn bağlantı noktalarından birini seçebilirsiniz.

Güvenlik

S: Amazon Redshift, veri kaynağımı nasıl güvenli tutar?

Amazon Redshift, entegre AWS IAM entegrasyonu, tek oturum açma için kimlik federasyonu (SSO), çok faktörlü kimlik doğrulama, sütun düzeyinde erişim kontrolü, Amazon Virtual Private Cloud (Amazon VPC) ile sektör lideri güvenliği destekler ve taşıma sırasında ve beklemedeyken verilerinizi korumak için entegre AWS KMS entegrasyonu sağlar. Amazon Redshift, endüstri standardı şifreleme tekniklerini kullanarak verilerinizi şifreler ve hem aktarım hem bekleme sırasında güvenli tutar. Amazon Redshift, aktarım sırasında verilerin güvenli tutulması için istemci uygulamanızla Redshift veri ambarı kümeniz arasında SSL özellikli bağlantıları destekler. Verilerinizin beklerken güvenli tutulması için Amazon Redshift tarafından veriler diske yazılırken donanım hızlandırmalı AES-256 kullanılarak her bir blok şifrelenir. Bu işlemler, ara sorgu sonuçları dahil olmak üzere diske yazılan her şeyi şifreleyen G/Ç alt sisteminin düşük bir düzeyinde gerçekleşir. Bloklar olduğu gibi yedeklendiğinden, yedekler de şifreli olur. Amazon Redshift varsayılan olarak anahtar yönetimini üstlenir ancak anahtarlarınızı AWS Key Management Service aracılığıyla yönetmeyi tercih edebilirsiniz. Tüm Amazon Redshift güvenlik özellikleri hiçbir ek ücret olmadan sunulur. Redshift Spectrum, kendi hesabınızın AWS Key Management Service (KMS) tarafından yönetilen varsayılan anahtarını kullanarak Amazon S3’ün Sunucu Tarafı Şifreleme (SSE) özelliğini destekler.

S: Redshift, sütun düzeyinde güvenlik gibi ayrıntılı erişim kontrollerini destekliyor mu?

Evet. Ayrıntılı sütun düzeyi güvenlik denetimleri, kullanıcıların yalnızca erişimi olması gereken verileri görmesini sağlar. Amazon Redshift, yerel tablolar için sütun düzeyinde erişim kontrolünü destekler ve böylece bir kullanıcıya veya kullanıcı grubuna sütun düzeyinde ayrıcalıklar vererek/bunları iptal ederek tablonun veya görünümün her bir sütununa erişimi kontrol edebilirsiniz. Redshift, AWS Lake Formation ile entegre olarak Lake Formation'ın sütun düzeyi erişim denetimlerinin data lake'teki verilerde yürütülen Redshift sorgularına da uygulanmasını sağlar.

S: Amazon Redshift, veri maskelemeyi veya verileri belirtece dönüştürmeyi destekler mi?

AWS Lambda kullanıcı tanımlı işlevleri (UDF'ler), bir AWS Lambda işlevini Amazon Redshift'te bir UDF olarak kullanmanıza ve bunu Redshift SQL sorgularından çağırmanıza olanak tanır. Bu işlevsellik, diğer hizmetlerle veya üçüncü taraf ürünleriyle daha sıkı entegrasyon sağlamak üzere SQL sorgunuz için özel uzantılar yazmanızı sağlar. Protegrity gibi satıcılarla entegrasyon kurarak verilerin harici olarak belirtece dönüştürülmesini, maskelenmesini, tanımlanmasını veya kimlik bilgilerinden arındırılmasını mümkün kılmak, ayrıca hassas verileri her kullanıcının izinlerine ve gruplarına bağlı olarak sorgu anında koruma altına almak ya da korumadan çıkarmak için Lambda UDF'leri yazabilirsiniz.

S: Amazon Redshift, çoklu oturum açmayı destekliyor mu?

Evet. Microsoft Azure Active Directory, Active Directory Federation Services, Okta, Ping Federate veya diğer SAML uyumlu kimlik sağlayıcıları gibi kurumsal kimlik sağlayıcılarını kullanmak isteyen müşteriler, Amazon Redshift'i çoklu oturum açma sağlayacak şekilde yapılandırabilir.

S: Amazon Redshift, Microsoft Azure Active Directory ile çoklu oturum açmayı nasıl destekler?

Microsoft Azure Active Directory (AD) kimlik bilgileriyle Amazon Redshift kümesinde oturum açabilirsiniz. Bu, Redshift’te Azure Active Directory kimliklerini çoğaltmadan Redshift’te oturum açabilmenizi sağlar.

S: Amazon Redshift, çok faktörlü kimlik doğrulamayı (MFA) destekliyor mu?

Evet. Amazon Redshift kümenizde kimlik doğrulaması yaparken ek güvenlik için çok faktörlü kimlik doğrulamayı (MFA) kullanabilirsiniz.

S: Amazon Redshift'i Amazon Virtual Private Cloud'da (Amazon VPC) kullanabilir miyim?

Evet. Amazon Redshift'i VPC yapılandırmanızın bir parçası olarak kullanabilirsiniz. Amazon VPC ile kendi veri merkezinizde çalıştırabileceğiniz geleneksel bir ağa çok benzeyen bir sanal ağ topolojisi tanımlayabilirsiniz. Bu sayede Redshift veri ambarı kümenize kimlerin erişebileceği konusunda tam denetime sahip olursunuz. Redshift Spectrum'u Amazon VPC'nizin parçası olan bir Redshift kümesi ile kullanabilirsiniz.

Amazon Redshift, bir VPC'deki Redshift kümenize bağlanmaya yarayan yönetilen VPC uç noktalarını (AWS PrivateLink tarafından sağlanır) da destekler. Amazon Redshift tarafından yönetilen bir uç nokta ile VPC'niz dahilindeki Redshift veri ambarınıza, genel IP'ler kullanmadan veya trafiğin interneti dolaşmasına gerek olmadan aynı veya başka bir AWS hesabındaki ya da şirket içinde çalışan başka bir VPC'deki istemci uygulamalarınızdan özel olarak erişebilirsiniz.

S: Amazon Redshift işlem düğümlerime doğrudan erişebilir miyim?

Hayır. Amazon Redshift işlem düğümleriniz özel bir ağ alanındadır ve bunlara yalnızca veri ambarı kümenizin baş düğümünden erişilebilir. Bu mekanizma, verileriniz için ek bir güvenlik katmanı sağlar.

S: Redshift, veritabanında rol tabanlı erişim denetimini destekliyor mu? (Ön duyuru)

Amazon Redshift, yakın zamanda rol tabanlı erişim denetimi desteği sunacaktır.

Erişilebilirlik ve dayanıklılık

S: Bir düğümümdeki sürücülerden biri arızalanırsa veri ambarı kümemin erişilebilirliği ve veri dayanıklılığı bundan nasıl etkilenir?

Amazon Redshift, bu durumlarda sürücü veya düğüm arızasını tespit eder ve küme düğümünü otomatik olarak değiştirir. Yoğun İşlem (DC) ve Yoğun Depolama (DS2) kümelerinde yüksek veri dayanıklılığı sağlamak için veriler işlem düğümlerinde depolanır. Bir düğüm değiştirildiğinde, veriler diğer düğüm üzerindeki yansıtma kopyasından yenilenir.

RA3 kümeleri ve Redshift sunucusuz, veriler Amazon S3'te depolandığı ve yerel sürücü, bir veri önbelleği olarak kullanıldığı için aynı şekilde etkilenmez. Düğüm değiştirme durumunda, veriler Amazon S3'ten alınır. Amazon S3, %99,9999 oranında veri dayanıklılığı garantisi sunar. Çok düğümlü bir arıza veya kümenin bir bütün olarak arızalanması durumunda, verilerin güncel bir kopyası S3'te mevcuttur ve küme, herhangi bir veri kaybı olmadan aynı AZ veya başka bir AZ kullanılarak kurtarılabilir.

Yedek bir düğüm tedarik edilip veritabanına eklenene kadar veri ambarı kümesi sorgulara ve güncelleştirmelere kapalı olur. Amazon Redshift, yedek düğümünüzü hemen kullanıma hazır hale getirir ve en sık erişilen verilerinizi RA3 ve sunucusuzdaki Amazon S3'ten, DS2 ve Amazon Yoğun İşlem'deki (DC2) yansıtmadan yükler. Tek düğümlü DC2 ve DS2 kümeleri, veri replikasyonunu desteklemez. Bir sürücünün başarısız olması durumunda kümeyi S3'teki bir anlık yedekten geri yüklemeniz gerekir. Tek düğümlü RA3.XLPLUS kümeler, S3'te depolanan veriler kullanılarak herhangi bir veri kaybı olmaksızın AWS Support yardımıyla yeniden oluşturulabilir. Erişilebilirliği en yüksek seviyeye çıkarmak için üretimde en az iki düğüm kullanılmasını öneririz.

S: Tek bir düğüm arızalanırsa veri ambarı kümemin erişilebilirliği ve veri dayanıklılığı bundan nasıl etkilenir?

Amazon Redshift, veri ambarı kümenizde başarısız olan düğümü otomatik olarak algılayıp değiştirir. Yedek bir düğüm tedarik edilip veritabanına eklenene kadar veri ambarı kümesi sorgulara ve güncelleştirmelere kapalı olur. Amazon Redshift, yedek düğümünüzü anında erişilebilir hale getirir ve verilerinizi olabildiğince hızlı bir şekilde sorgulamaya başlayabilmeniz için S3’ten önce en sık erişilen verileri yükler. Tek düğümlü kümeler veri replikasyonunu desteklemez. Bir sürücünün başarısız olması durumunda kümeyi S3’teki anlık yedekten geri yüklemeniz gerekir. Üretim için en az iki düğüm kullanılmasını öneririz.

S: Veri ambarı kümemin Erişilebilirlik Alanı'nda (AZ) bir kesinti yaşanırsa veri ambarı kümemin erişilebilirliği ve veri dayanıklılığı bundan nasıl etkilenir?

Amazon Redshift veri ambarı kümenizin Erişilebilirlik Alanı erişilemez hale gelirse, Amazon Redshift hiçbir veri kaybı veya uygulama değişikliği yaşanmadan kümenizi otomatik olarak başka bir AWS Erişilebilirlik Alanı'na (AZ) taşır. Bunu aktifleştirmek için kümenizin yapılandırma ayarlarında taşınma özelliğini etkinleştirmeniz gerekir.

S: Amazon Redshift, Multi-AZ Dağıtımları destekler mi?

Amazon Redshift şu anda yalnızca Tek Bölgeli dağıtımları destekler. Olağanüstü durum kurtarma (DR) yapılandırmasını ayarlamak için kümenizde Bölgeler arası anlık yedek kopyasını etkinleştirebilirsiniz. Bu işlem, kümenizdeki tüm anlık yedekleri başka bir AWS Bölgesine çoğaltacaktır. Bir DR olayı yaşanması durumunda, çoğaltılmış Bölgedeki anlık yedekler geri yüklenerek yeni bir küme oluşturulabilir. Amazon Redshift, bir tüketici kümenin başka bir bölgede bulunan üretici kümedeki gerçek zamanlı verilere erişebildiği Bölgeler arası veri paylaşımını da destekler. Bu özellik sadece Amazon Redshift Sunucusuz ve RA3'te desteklenir.

Sorgulama ve analiz

S: Amazon Redshift ve Redshift Spectrum, tercih ettiğim iş zekası yazılım paketi ve ETL araçlarıyla uyumlu mudur?

Evet, sektör standardı SQL kullanmakta olan Amazon Redshift'e, standart JDBC ve ODBC sürücüleri kullanılarak erişilir. Amazon Redshift özel JDBC ve ODBC sürücülerini Redshift Console'un Connect Client (İstemci Bağlama) sekmesinden indirebilirsiniz. Popüler BI ve ETL satıcılarıyla olan entegrasyonumuzu doğruladık ve bunların bazıları, verilerinizi yükleyip analiz etmeye başlamanıza yardımcı olmak için ücretsiz denemeler sunuyor. Dilerseniz AWS Marketplace'e giderek Amazon Redshift ile çalışacak şekilde tasarlanmış çözümleri dakikalar içinde dağıtıp yapılandırabilirsiniz.

Amazon Redshift Spectrum, tüm Amazon Redshift istemci araçlarını destekler. İstemci araçları ODBC ve JDBC bağlantıları kullanarak Amazon Redshift kümesinin uç noktasına bağlanmaya devam edebilir. Değişiklik gerekmez.

Tam olarak aynı söz dizimini kullanırsınız ve Redshift Spectrum’daki tablolara erişim için Redshift kümenizin yerel depolama alanındaki tablolarla aynı sorgulama özelliklerine sahip olursunuz. Harici tablolara, bunlar kaydedilirken kullanılan CREATE EXTERNAL SCHEMA komutunda tanımlanan şema adı kullanılarak başvurulur.

S: Amazon Redshift Spectrum hangi veri ve sıkıştırma biçimlerini destekler?

Amazon Redshift Spectrum şu anda Avro, CSV, Grok, Amazon Ion, JSON, ORC, Parquet, RCFile, RegexSerDe, Sequence, Text ve TSV dahil olmak üzere birçok açık kaynak veri biçimini destekler.

Amazon Redshift Spectrum şu anda Gzip ve Snappy sıkıştırmayı destekler.

S: Yerel depolama alanımdaki bir tablo, harici bir tabloyla aynı ada sahipse ne olur?

Yerel tablolarda olduğu gibi, sorgunuzda şema adını şema_adı.tablo_adı biçiminde kullanarak tam olarak hangisini kast ettiğinizi seçebilirsiniz.

S: S3 data lake’imle ilgili meta verileri depolamak için bir Hive Metastore kullanıyorum. Redshift Spectrum’u kullanabilir miyim?

Evet. CREATE EXTERNAL SCHEMA komutu Hive Metastore’ları destekler. Şu anda Hive Metastore’a yönelik DDL desteği sunmuyoruz.

S: Kümemde oluşturulan tüm harici veritabanı tablolarının listesine nasıl ulaşabilirim?

Bu bilgiyi edinmek için SVV_EXTERNAL_TABLES adlı sistem tablosunu sorgulayabilirsiniz.

S: Redshift, SQL ile birlikte Makine Öğrenimi kullanma özelliğini destekler mi?

Evet. Amazon Redshift ML özelliği, SQL kullanıcılarının aşina oldukları SQL komutlarını kullanarak makine öğrenimi (ML) modellerini oluşturmasını, eğitmesini ve dağıtmasını kolaylaştırır. Amazon Redshift ML, tam olarak yönetilen bir makine öğrenimi hizmeti olan Amazon SageMaker ile Amazon Redshift'teki verilerinizden yararlanmanıza olanak tanır. Amazon Redshift, hem denetimsiz öğrenmeyi (K-Means) hem de denetimli öğrenmeyi (Autopilot, XGBoost, MLP algoritmaları) destekler.

S: Amazon Redshift, verileri sorgulamak için bir API sağlıyor mu?

Amazon Redshift; her türlü geleneksel, bulut temelli ve container'lı, sunucusuz web hizmetleri tabanlı ve olay odaklı uygulamalarla Amazon Redshift'teki verilerinize sorunsuz şekilde erişmek amacıyla kullanabileceğiniz bir Veri API'si sunmaktadır. Sürücüleri yapılandırmanız ve veritabanı bağlantılarını yönetmeniz gerekmediği için Veri API'si, Amazon Redshift erişimini basitleştirir. Bunun yerine, Veri API'si tarafından sağlanan güvenli bir API uç noktasını çağırarak bir Amazon Redshift kümesinde SQL sorguları çalıştırabilirsiniz. Veritabanı bağlantılarını yönetme ve verileri arabelleğe alma işini Veri API'si üstlenir. Veri API'si zaman uyumsuz olduğundan, sonuçlarınızı daha sonra alabilirsiniz. Sorgu sonuçlarınız 24 saat boyunca depolanır.

S: Amazon Redshift Veri API'siyle birlikte hangi tür kimlik bilgilerini kullanabilirim?

Veri API'si hem IAM kimlik bilgilerini hem de AWS Secrets Manager'dan gizli anahtar kullanımını desteklemektedir. Veri API'sinin AWS Identity and Access Management (IAM) kimlik bilgilerini federe etmesi sayesinde API çağrılarında veritabanı kimlik bilgilerini aktarmadan Okta veya Azure Active Directory gibi kimlik bilgileri sağlayıcılarını ya da Secrets Manager'da depolanan veritabanı kimlik bilgilerini kullanabilirsiniz.

S: Amazon Redshift Veri API'sini AWS CLI'dan kullanabilir miyim?

Evet, aws redshift-data komut satırı seçeneğiyle Veri API'sini AWS CLI'dan kullanabilirsiniz.

S: Redshift Veri API'si diğer AWS hizmetlerine entegre midir?

Veri API'sini AWS Lambda, AWS Cloud9, AWS AppSync ve Amazon EventBridge gibi diğer hizmetlerden kullanabilirsiniz.

S: Amazon Redshift Veri API'sini kullanmak için ayrı bir ödeme yapmam gerekir mi?

Hayır, Veri API'sini kullanmaya ilişkin ayrı bir ücret söz konusu değildir.

Yedekleme ve geri yükleme

S: Amazon Redshift, verilerimi nasıl yedekler? Kümemi bir yedekten nasıl geri yükleyebilirim?

Amazon Redshift RA3 kümeleri ve Amazon Redshift Sunucusuz, kullanılabilir verilerin daima en son kopyasını barındıran Redshift Tarafından Yönetilen Depolama'yı kullanır. DS2 ve DC2 kümeleri, kümedeki verileri yansıtarak bir arıza durumunda en son kopyanın mevcut olmasını sağlar. Yedekler tüm Redshift küme türlerinde otomatik olarak oluşturulup 24 saat süreyle saklanır ve son 24 saat için sunucusuz kurtarma noktalarında sağlanır.

Ayrıca, süresiz olarak saklayabileceğiniz kendi yedeklerinizi de oluşturabilirsiniz. Bu yedekler herhangi bir zamanda oluşturulabilir ve Amazon Redshift otomatik yedekleri veya Amazon Redshift Sunucusuz kurtarma noktaları, daha uzun süreli saklama amacıyla bir kullanıcı yedeğine dönüştürülebilir.

Amazon Redshift aynı zamanda, olağanüstü durum kurtarma için anlık yedeklerinizi veya kurtarma noktalarınızı bir başka Bölgedeki Amazon S3'e zaman uyumsuz olarak çoğaltabilir.

Bir DS2 veya DC2 kümesinde ücretsiz yedek depolama alanı, veri ambarı kümesindeki düğümlerin toplam depolama boyutuyla sınırlıdır ve yalnızca etkin veri ambarı kümeleri için geçerlidir.

Örneğin, toplam 8 TB veri ambarı depolama alanınız varsa ücretsiz olarak en fazla 8 TB yedek depolama alanı sağlarız. Yedeklerinizin tutulma süresini bir günden uzun yapmak istiyorsanız AWS Management Console ya da Amazon Redshift API'lerini kullanarak bunu yapabilirsiniz. Otomatik anlık yedekler hakkında daha fazla bilgi edinmek için lütfen Amazon Redshift Yönetim Kılavuzu'na bakın.

Amazon Redshift yalnızca değişen verileri yedeklediğinden, çoğu anlık yedek ücretsiz depolama alanınızın sadece küçük bir miktarını kullanır. Bir yedeği geri yüklemeniz gerektiğinde, yedek tutma aralığınız içinde tüm otomatik yedeklere erişebilirsiniz. Geri yüklenecek yedeği seçtiğinizde, yeni bir veri ambarı kümesi tedarik eder ve verilerinizi buna geri yükleriz.

S: Otomatik yedeklerimin ve anlık yedeklerimin tutulduğu süreyi nasıl yönetirim?

Otomatik yedeklerinizin tutulduğu süreyi AWS Management Console veya ModifyCluster API'si ile RetentionPeriod parametresini değiştirerek yönetebilirsiniz. Otomatik yedeklemeyi tamamen kapatmak istiyorsanız tutma dönemini 0 değerine ayarlayabilirsiniz (önerilmez).

S: Veri ambarı kümemi silersem yedeklerime ne olur?

Bir veri ambarı kümesini sildiğinizde, silme işleminin üzerine son bir anlık yedeğin oluşturulup oluşturulmayacağını belirtme olanağınız vardır. Bu, silinen veri ambarı kümesinin daha sonra geri yüklenmesine olanak sağlar. Veri ambarı kümenizin daha önce manuel olarak oluşturulmuş tüm anlık yedekleri korunur ve bunları silmediğiniz sürece standart Amazon S3 fiyatları üzerinden faturalandırma devam eder.

İzleme ve bakım

S: Amazon Redshift veri ambarı kümemin performansını nasıl izleyebilirim?

Amazon Redshift veri ambarı kümenize yönelik işlem kullanımı, depolama kullanımı ve okuma/yazma trafiğine ilişkin ölçümlere AWS Management Console veya Amazon CloudWatch API'leri aracılığıyla ücretsiz olarak erişebilirsiniz. Amazon CloudWatch'un özel ölçüm işlevi aracılığıyla, kullanıcı tarafından tanımlanmış başka ölçümler ekleyebilirsiniz. AWS Management Console, tüm kümelerinizin durumunu ve performansını izlemenize yardımcı olacak bir izleme panosu sağlar. Amazon Redshift ayrıca AWS Management Console aracılığıyla sorgu ve küme performansıyla ilgili bilgi sağlar. Bu bilgiler, sorgu planlarını ve yürütme istatistiklerini görüntüleyerek en çok sistem kaynağını hangi kullanıcıların ve sorguların tükettiğini görmenize ve performans sorunlarını tanılamanıza olanak tanır. Ayrıca, verilerinizin ve sorgularınızın tüm düğümlere dengeli bir şekilde dağıldığından emin olmak için işlem düğümlerinizin her birindeki kaynak kullanımını görebilirsiniz.

S: Bakım aralığı nedir? S: Yazılım bakımı sırasında veri ambarı kümeme erişilebilir mi?

Amazon Redshift, düzenli aralıklarla bakım gerçekleştirerek düzeltmeleri, geliştirmeleri ve yeni özellikleri kümenize uygular. Kümeyi programlama yoluyla ya da Redshift Console’u ile değiştirerek zamanlanan bakım aralıklarını değişltirebilirsiniz. Bu bakım aralıkları sırasında Amazon Redshift kümeniz normal işlemlere kapalı olur. Bakım aralıkları ve bölgeye göre zamanlamalar hakkında daha fazla bilgi edinmek için Amazon Redshift Yönetim Kılavuzu’nun Bakım Aralıkları bölümüne bakın.

Amazon Redshift fiyatlandırması hakkında daha fazla bilgi edinin

Fiyatlandırma sayfasını ziyaret edin
Oluşturmaya hazır mısınız?
Amazon Redshift'i kullanmaya başlayın
Başka sorunuz mu var?
Bize ulaşın