AWS Türkçe Blog

Amazon DataZone’u kullanarak kurumsal sınırların ötesindeki verilerin kilidini açın – artık genel kullanıma sunuldu

Orijinal Makale: Link (Shikha Verma, Steve McPherson, Priya Tiruthani)

Amazon DataZone‘un genel kullanıma sunulduğunu duyurmaktan heyecan duyuyoruz. Amazon DataZone, müşterilerin verileri kurumsal sınırlar ötesinde keşfetmesini, erişmesini, paylaşmasını ve yönetmesini sağlayarak, veri ve analitik araçlarını kuruluştaki herkes için erişilebilir hale getirmenin farklılaştırılmamış ağır yükünü azaltır. Amazon DataZone ile veri mühendisleri, veri bilimcileri ve veri analistleri gibi veri kullanıcıları, birleşik bir veri portalı kullanarak AWS hesaplarındaki verileri paylaşabilir ve bunlara erişebilir, böylece ekipleri ve kuruluşları genelinde bu verileri keşfedebilir, kullanabilir ve bu veriler üzerinde iş birliği yapabilirler. Ayrıca veri sahipleri ve veri sorumluları, verilere iş bağlamı ekleyerek veri keşfini kolaylaştırabilir ve kullanıcı arayüzünde önceden tanımlanmış onay iş akışları aracılığıyla verilere erişim yönetimini dengede tutabilir.

Bu yazımızda, müşterilerimizden duyduğumuz ve bizi Amazon DataZone’u geliştirmeye yönlendiren bilgileri paylaşıyor, belirli müşteri kullanım örneklerini ve genel ön izleme sırasında Amazon DataZone’u deneyen müşterilerimizden aldığımız görüşleri ele alıyoruz. Ardından Amazon DataZone’un avantajlarını açıklıyor ve temel özellikleri üzerinden size yol gösteriyoruz.

Veri yönetimi ve yönetişiminin zorluk yaratan ortak noktaları:

  1. Veri keşfi, özellikle de hesaplar ve bölgeler arasında dağıtılmış verilerin bulunması – Analiz için kullanılacak verileri bulmak, kuruluşların genellikle onlarca hatta binlerce veri kaynağına yayılmış petabaytlarca veriye sahip olması nedeniyle oldukça zordur.
  2. Verilere erişim – Veri erişim kontrolü zordur, kuruluşlar arasında farklı şekilde yönetilir ve genellikle elle onay gerektirir, bu da zaman alan bir süreç olabilir ve güncel tutulması zordur, bu nedenle analistlerin ihtiyaç duydukları verilere erişememesine neden olur.
  3. Araçlara erişim – Veri kullanıcıları, aynı yönetilen veriler ile tercih ettikleri farklı araçları kullanmak isterler. Verilere erişim her bir araç tarafından farklı şekilde yönetildiği için bu zor bir durumdur.
  4. İş birliği –  Analistler, veri bilimcileri ve veri mühendisleri genellikle uçtan uca analitik yolculuğunda farklı adımlara hakimdir, ancak kendi seçtikleri araçları kullanarak aynı yönetilen veriler üzerinde iş birliği yapmanın basit bir yoluna sahip değildir.
  5. Veri yönetişimi – Verileri yönetmeye yönelik yapılar ayrı araçlarda gizlidir ve farklı ekipler tarafından farklı şekilde yönetilir, bu da kuruluşların kimin neye neden eriştiğine dair izlenebilirliğe sahip olmasını engeller.

Amazon DataZone’un üç temel avantajı

Amazon DataZone, müşterilerin verileri kurumsal sınırlar ötesinde keşfetmesini, paylaşmasını ve yönetmesini sağlar.

  • Kurumsal sınırlar ötesinde veri erişimini yönetin. Bireysel kimlik bilgilerine güvenmeden, doğru verilere doğru kullanıcı tarafından doğru amaçla (kuruluşunuzun güvenlik düzenlemelerine uygun olarak) erişilmesini sağlamaya yardımcı olun. Veri varlığı kullanımı konusunda şeffaflık sağlayın ve yönetilen bir iş akışıyla veri üyeliklerini onaylayın. Kullanım denetimi özellikleri sayesinde projeler genelinde veri varlıklarını izleyin.
  • İşle ilgili içgörüleri desteklemek için paylaşılan veriler ve araçlar aracılığıyla veri çalışanlarını buluşturun. Ekipler arasında sorunsuz bir şekilde iş birliği yaparak ve veri ve analiz araçlarına kendi kendine hizmet erişimi sağlayarak iş ekibinizin verimliliğini artırın. Kataloglanmış verileri aramak, paylaşmak ve bunlara erişmek için iş terimlerini kullanın ve iş sözlüğü ile kullanmak istedikleri veriler hakkında daha fazla bilgi edinmek için verileri yapılandırılmış tüm kullanıcılar için erişilebilir hale getirin.
  • Makine öğrenimi (machine learning – ML) ile veri keşfini ve kataloglamayı otomatikleştirin. Veri özniteliklerini iş veri kataloğuna elle girmek için gereken süreyi azaltın ve hataların ortaya çıkmasını en aza indirin. Veri kataloğundaki daha fazla ve daha zengin veri, arama deneyimini de iyileştirir. Veri arama ve kullanma sürenizi haftalardan günlere indirin.

Aşağıda Amazon DataZone’un müşterilerine sağladığı temel avantajlar yer almaktadır.

Figure 1: Benefits of Amazon DataZone

Şekil 1: Amazon DataZone’un Faydaları

Bu faydaları sağlamak için, bu serviste hangi yeteneklerin bulunduğunu görelim.

Figure 2: Capabilities of Amazon DataZone

Şekil 2: Amazon DataZone’un Yetenekleri

Amazon DataZone aşağıdaki ayrıntılı özellikleri sağlar.

  1. İş odaklı alanlar – Bir DataZone etki alanı, kendi veri varlıkları, kendi veri tanımı veya iş terminolojisi dahil olmak üzere kendi verilerini yönetebilen ve kendi yönetim standartlarına sahip olabilen bir kuruluş içindeki bir iş kolunun (line of business – LOB) veya bir iş alanının belirgin sınırını temsil eder. Etki alanı, bir müşterinin Amazon DataZone ile yolculuğunun başlangıç noktasıdır. DataZone’u kullanmaya ilk başladığınızda, bir etki alanı ve bir etki alanı içinde var olacak iş veri kataloğu, projeler ve ortamlar gibi tüm temel bileşenleri oluşturursunuz.
    1. Bir Amazon DataZone etki alanı, arama ve keşif için ilişkili bir iş veri kataloğu, keşif amacıyla kullanılan veri varlıklarını düzenlemek için bir dizi meta veri tanımı ve kullanıcıların ve grupların veri varlıklarını tüketmesi ve yayınlaması için entegre analitik ve makine öğrenimi araçlarına sahip veri projeleri içerir.
    2. Bir Amazon DataZone etki alanı, bir veri ağı oluşturmak için bu hesaplardaki veri gölü veya veri ambarı verilerini (örneğin, AWS Glue Data Catalog) bağlayıp alarak veya desteklenen AWS Bölgeleri genelinde bu hesaplarda projeler ve ortamlar oluşturup çalıştırarak birden fazla AWS hesabına yayılabilir.
    3. Amazon DataZone etki alanları, kaynakları hesaplar arasında güvenli bir şekilde paylaşmak için AWS Resource Access Manager’ın (AWS RAM) yeteneklerini beraberinde getirir.
    4. Bir Amazon DataZone etki alanı oluşturulduktan sonra etki alanı, kuruluşun yapılandırılmış kullanıcılarının verileri self servis bir şekilde kataloglamak, keşfetmek, yönetmek, paylaşmak ve analiz etmek için gidebilecekleri tarayıcı tabanlı bir web uygulaması sağlar. Veri portalı, kimlik doğrulama için AWS IAM Identity Center (AWS Single Sign-On’un devamı) ve AWS Identity and Access Management (IAM) principals aracılığıyla kimlik sağlayıcılarını destekler.
    5. Örneğin, bir pazarlama ekibi “Pazarlama” adında bir alan adı oluşturabilir ve bunun üzerinde tam yetkiye sahip olabilir. Benzer şekilde, bir satış ekibi “Sales” adında bir alan adı oluşturabilir ve bunun üzerinde tam yetkiye sahip olabilir. Satış ekibi pazarlama ile veri paylaşmak istediğinde, pazarlama ekibi bir satış hesabını pazarlama alanıyla ilişkilendirerek bu hesaba erişim verebilir ve satış kullanıcısı pazarlama alanının Amazon DataZone portal bağlantısını kullanarak verilerini pazarlama ekibiyle paylaşabilir.
  2. Kuruluş çapında iş veri kataloğu – Kullanıcılarınızın verileri hızlı ve verimli bir şekilde bulması ve anlaması için verileri iş bağlamıyla görünür hale getirebilirsiniz. Kataloğun özü, farklı kaynaklardan gelen verileri kataloglamanın yanı sıra, güven oluşturmak ve veri arayan tüketiciler için daha iyi karar vermeyi kolaylaştırmak için bu meta verileri ek iş bağlamıyla güçlendirmeye odaklanmıştır.
    1. Terminolojide standartlaşma – Sözlükler oluşturarak ve terimler için terim ilişkileriyle birlikte ayrıntılı açıklamalar ekleyerek veri yayıncıları ve tüketicileri arasında iletişim kurmak için iş terminolojinizi standartlaştırabilirsiniz. Bu terimler varlıklarla ve sütunlarla eşleştirilebilir ve bu varlıkların tanımının standartlaştırılmasına ve temel verilerin ayrıntılarının keşfedilmesine ve anlaşılmasına yardımcı olabilir.
    2. İş meta verilerini özelleştirmek için yapı taşlarını oluşturma – Kataloğunuzu genişletilebilir bir şekilde oluşturmayı kolaylaştırmak için Amazon DataZone, ihtiyaçlarınıza göre genişletilebilecek bazı temel yapı taşları sunar. Meta veri form türleri ve varlık türleri, varlıklarınızı tanımlamak için şablon olarak kullanılabilir. Bu türler, bir etki alanının gereksinimlerine uyacak şekilde ek bağlam ve ayrıntıları artırmak için özelleştirilebilir. Bu sürümde Amazon DataZone, AWS Glue tabloları ve görünümleri, Amazon Redshift tabloları ve görünümleri ve S3 nesneleri gibi kullanıma hazır varlık türlerini desteklemek için AWS Glue tablo formu, Amazon Redshift tablo formu, Amazon Simple Storage Service (Amazon S3) nesne formu gibi kullanıma hazır bazı meta veri form türleri sağlar.
    3. Yapılandırılmış, yapılandırılmamış ve özelleştirilmiş varlıkların kataloglanması– Artık yalnızca AWS Glue veri kataloglarını veya Amazon Redshift tablolarını değil, Amazon DataZone API’lerini kullanarak özelleştirilmiş varlıkları da kataloglayabilirsiniz. Kataloglanan varlıklar, bir tablo, bir gösterge tablosu, bir ML modeli veya gösterge tablosunun arkasındaki sorguyu gösteren bir SQL kod bloğu içerebilen tüketilebilir bir varlık birimini temsil edebilir. Özelleştirilmiş varlıklarla Amazon DataZone, meta veri form türlerini bir varlık türüne ekleme ve ardından bu varlıkların daha iyi tüketilmesi için standartlaştırılmış iş sözlüğü terimleri de dahil olmak üzere iş bağlamıyla zenginleştirme olanağı sağlar. Buna ek olarak, AWS Glue veri katalogları ve Amazon Redshift tabloları için Amazon DataZone veri kaynaklarını kullanarak veri kümelerinin teknik meta verilerini bir program dahilinde yönetilen bir şekilde iş veri kataloğuna getirebilirsiniz. Varlıklar artık revizyonları da destekleyerek kullanıcıların iş ve teknik meta verilerdeki değişiklikleri tanımlamasına olanak tanıyor.
    4. Otomatik işletme adı oluşturma – İçeri alınan teknik kataloğu iş bağlamıyla zenginleştirmek zaman alıcı, zahmetli ve hataya açık olabilir. Bunu daha basit hale getirmek için, bir varlığın adının ve sütun adlarının oluşturulmasını otomatikleştirmek üzere Amazon DataZone’a üretken yapay zeka (AI) yetenekleri getiren ilk özelliği sunuyoruz. Amazon DataZone, varlığa bu bilgilerin eklenmesini önerir ve ardından bu önerileri kabul etme veya reddetme konusunda kontrolü üreticiye devreder.
  3. Veri projelerini kullanarak federe yönetişim – Amazon DataZone veri projeleri, kullanıcıların, veri varlıklarının ve analiz araçlarının iş kullanım durumuna dayalı gruplandırmalarını oluşturarak AWS analitiklerine erişimi basitleştirir. Veri projeleri, proje üyelerinin iş birliği yapabileceği, veri alışverişinde bulunabileceği ve eserleri paylaşabileceği bir alan sağlar. Projeler güvenlidir, böylece yalnızca projeye eklenen kullanıcılar birlikte çalışabilir. Projeler sayesinde Amazon DataZone, verilerin kime ait olduğuna bağlı olarak veri sahipliğini ekipler arasında dağıtmakta ve ayrıca tüketiciler verilere erişim talep ettiğinde erişim yönetimini bu sahiplerle birleştirmektedir. Projelerde kullanıma sunulan temel yetenekler şunları içerir:
    1. Sahiplik ve kullanıcı yönetimi – Bir kuruluşta, farklı personalara sunulan roller ve sorumluluklar değişiklik gösterir. Bir kullanıcı veya grubun Amazon DataZone varlıklarıyla çalışırken neler yapabileceğini tanımlamayı özelleştirmek için projeler artık bir kullanıcı yönetimi veya rol mekanizması olarak da hizmet veriyor. Amazon DataZone’daki sözlükler, meta veri formları ve varlıklar gibi her varlık projelere aittir.
    2. Projeler ve ortamlar – Projeler artık altyapıdan ayrıştırılmıştır – kullanıcıların proje sahipleri veya katkıda bulunanlar olarak ayarlanmasını sağlayan proje oluşturma ve ardından ortamlar (environments) adı verilen kaynakların ayarlanması vardır. Ortamlar, kullanıcıların verilerle çalışması için gereken altyapıyı (örneğin AWS Glue veritabanı) yönetir. Bu ayrım, projenin kullanım durumu kapsayıcısı olmasını sağlarken, ortam farklı altyapı ortamlarına (örneğin, Amazon Redshift kullanan veri gölleri veya veri ambarları) dallanma esnekliği verir. Yöneticiler, ne tür projeler için ne tür bir altyapının mevcut olması gerektiğini belirleyebilir.
    3. Üyelik için kendi IAM rolünüzü getirin – Artık mevcut bir IAM principal kaynağını abonelik hedefi olarak kaydederek kullanabilir ve bu IAM kullanıcısı veya rolü için veri erişim onayı alabilirsiniz. Bu mekanizma ile projeler, diğer AWS hizmetlerindeki verilerle çalışma desteğini genişletir, çünkü kullanıcıların verileri keşfetmesine, gerekli onayı almasına ve kullanıcının önceden yetkilendirildiği bir hizmetteki verilere erişmesine izin verebilirsiniz.
    4. Erişim yönetimi ile iş akışına abone olun – Abonelik iş akışı, yalnızca doğru verilere doğru kullanıcılar tarafından doğru amaçla erişildiğini doğrulamak için üreticiler ve tüketiciler arasındaki verileri güvence altına alır ve self servis veri analizine olanak tanır. Bu özellik aynı zamanda veri kümelerinize kimin hangi iş kullanım durumu için eriştiğini hızlı bir şekilde denetlemenize ve projeler ve iş kolları genelinde kullanım ve maliyetleri izlemenize olanak tanır. Katalogda yayınlanan varlıklar için erişim yönetimi AWS Lake Formation veya Amazon Redshift kullanılarak yönetilir ve abonelik talebiniz onaylanıp kabul edildiğinde size bildirim (portalda veya Amazon CloudWatch’ta) gönderilir. AWS Lake Formation veya Amazon Redshift tarafından yönetilmeyen veriler için, Amazon DataZone’da abonelik onayını yönetebilir ve Amazon EventBridge event’lerini kullanarak özel mantıkla erişim izni verilen iş akışını tamamlayabilir ve ardından izin tamamlandığında API kullanarak Amazon DataZone’a geri rapor verebilirsiniz. Bu, tüketicinin analizleri için gereken verileri keşfetmek, anlamak ve bunlara abone olmak için yalnızca bir hizmetle arayüz oluşturmasını sağlar.
    5. Analitik araçları – Analitik araçlar – Amazon DataZone portalı, verileri işlemek için araç olarak Amazon Athena sorgu düzenleyicisi ve Amazon Redshift sorgu düzenleyicisi ile entegrasyon sağlar. Bu entegrasyon, sorgu araçlarına sorunsuz erişim sağlar ve kullanıcıların proje içinde abone olunan veri varlıklarını kullanmasına olanak tanır. Bu, yerleşik planlardaki kaynak yapılandırma tanımlarına göre dağıtılabilen Amazon DataZone ortamları kullanılarak gerçekleştirilir.
  4. API’lar – Amazon DataZone artık sistemle programlı olarak çalışmak için harici API’lere sahiptir. Amazon DataZone’u mevcut mimarinize ekleyebilirsiniz. Örneğin, Amazon DataZone’daki verileri kataloglamak için veri işlem hatlarınızı kullanmak ve tüketicilerin bu verileri sorunsuz bir şekilde aramasını, bulmasını, abone olmasını ve bunlara erişmesini sağlamak amacıyla ekleme yapabilirsiniz. Bu sürümde Amazon DataZone, katalog için yeni bir veri modeli sunuyor. Katalog API’leri, katalogdaki varlık türlerini tanımlamanıza ve yönetmenize olanak tanıyan tür sistemi tabanlı bir modeli destekler. Bu tür sistemi modelini kullanan kullanıcılar, farklı nesne türlerini temsil edebilen ve meta verileri nesneyle (varlık veya sütun) ilişkilendirebilen esnek ve ölçeklenebilir bir kataloğa sahip olacaklar. Benzer şekilde, kullanıcı arayüzündeki eylemler artık Amazon DataZone ile programlı olarak çalışmak istiyorsanız kullanabileceğiniz API’lere sahiptir.

Amazon DataZone için sık karşılaşılan müşteri kullanım alanları

Ön izleme müşterilerimizin Amazon DataZone ile gerçekleştirdiği bazı kullanım durumlarına bakalım.

Kullanım örneği 1: Veri keşfedilebilirliği

Bristol Myers Squibb, ilaçların keşfedilmesi ve geliştirilmesi için gereken süreyi %30’dan fazla azaltmaya yönelik bir girişimi aktif olarak sürdürmektedir. Bu stratejinin önemli bir bileşeni, veri paylaşımı zorluklarını ele almak ve veri kullanılabilirliğini optimize etmektir. AWS ile çalıştığımızda, Amazon DataZone’un veri ürünlerimizi oluşturmamıza, kataloglamamıza ve yönetmemize yardımcı olarak verilerimizi daha bulunabilir, erişilebilir, birlikte çalışabilir ve yeniden kullanılabilir (FAIR) hale getirdiğini gördük. Şu anda Amazon DataZone’un operasyonel hedeflerimizle uyumlu olup olmadığını belirlemek için kurumsal çerçevemiz içinde daha geniş uygulanabilirliğini değerlendiriyoruz.”

—David Y. Liu, Direktör, BT Araştırma Çözüm Mimarisi. Bristol Myers Squibb.

Kullanım örneği 2: Üretken yapay zeka girişimleri için yönetilen verileri paylaşın

“Birden fazla iş alanındaki verileri uyumlu hale getirerek bir veri paylaşımı kültürünü teşvik edebiliriz. Bu amaçla, geliştiricilerimizi bir platform oluşturmaktan ve sürdürmekten kurtararak özel çözümlere odaklanmalarını sağlamak için Amazon DataZone’u kullanıyoruz. AWS ekosistemindeki yetenekleri bir araya getirmek, veri analizinden daha hızlı iş içgörüleri elde etmek, standartlaştırılmış veri tanımları ve üretken yapay zekanın potansiyelinden yararlanmak gibi çeşitli nedenlerle AWS tarafından yönetilen bir hizmetten yararlanmak bizim için önemliydi. Guardant Health ve hizmet verdiğimiz hastalar için daha iyi sonuçlar üretmek üzere AWS ile devam eden ortaklığımızı dört gözle bekliyoruz. Bu sadece veriden daha fazlası; bizim dinamik yolculuğumuz.”

—Rajesh Kucharlapati, Veri, CRM ve Analitik Kıdemli Direktörü, Guardant Health

Kullanım örneği 3: Federe veri yönetişimi

“Veri odaklı olmak ana kurumsal hedeflerimizden biridir ve her zaman veri yönetişimi, veri gizliliği ve güvenliği alanlarındaki en iyi uygulamalar tarafından yönlendirilir. Itaú‘da veriler ana varlıklarımızdan biri olarak ele alınır; iyi veri yönetimi ve tanımı, AWS analitik hizmetlerinin her kullanımında çözümlerimizin temel parçalarıdır. AWS ekibiyle birlikte Amazon DataZone’u ön izleme aşamasında deneyebildik ve teknolojik ve iş ihtiyaçlarımızla uyumlu özellikler önerdik. Örneklerden biri, veri yönetişimi süreçlerinin basitleştirilmesi ve sorumlulukların iş birimleri arasında dağıtılması olan etki alanına göre veridir. Amazon DataZone’un genel olarak katkıda bulunanlarımızın kullanımına sunulmasıyla, veri analistleri, mühendisler ve bilim insanlarından oluşan ekipler için etki alanları arasında hızlı ve kolay bir şekilde kurallar oluşturabilmeyi ve basitleştirilmiş yönetişimle birden fazla iş kullanım senaryosunda veri hipoteziyle denemeler yapmayı teşvik etmeyi umuyoruz.”

—Priscila Cardoso Ferreira, Veri Yönetişimi ve Gizlilik Müfettişi, Itaú Unibanco

Kullanım örneği 4: Merkezi olmayan sahiplik

Holaluz‘da, verilerini paylaşmak ve yönetmek için bireysel ekiplere dağıtık sahipliğe tabiyken işletmelerimiz genelinde verileri birleştirmek temel önceliklerimizdir. Verilerimiz farklı ekiplere ait ve paylaşım genellikle merkezi ekibin erişim izni vermesi gerektiği anlamına geliyordu, bu da süreçlerimizde bir darboğaz yaratıyordu. Veri erişiminin veri sahibi ekip tarafından onaylanabildiği, merkezi olmayan mülkiyete sahip verileri analiz etmek için daha hızlı bir yola ihtiyacımız vardı. Amazon DataZone ön izlemesindeki kullanım durumlarını doğruladık ve sağlam bir iş veri kataloğu oluşturmak için genel kullanıma sunulduğunda başlamak için sabırsızlanıyoruz. Tüketicilerimiz yeni oluşturdukları varlıkları başkalarının keşfetmesi ve kullanması için bulabilecek, abone olabilecek ve geri yayınlayabilecek ve böylece bir veri çarkını mümkün kılacak.”

—Danny Obando, Sorumlu Veri Mimarı, Holaluz

Kullanım durumu #5: Kendin Yap (Do-It-Yourself – DIY) platformuna karşılık yönetilen hizmet

BTG Pactual‘da, işletmelerimiz genelinde verileri birleştirmek ve gözetim uygularken büyük ölçekte veri paylaşımına izin vermek temel önceliklerimizden biridir. Bunu kendimiz yapmak için özel çözümler geliştiriyor olsak da, geliştirme çabalarımızı ve kaynaklarımızı platform oluşturmak ve sürdürmek yerine BTG Pactual’ın özel yönetişim zorluklarını çözmeye odaklayabilmemiz için bu yetenekleri etkinleştirmek üzere AWS’nin yerel bir hizmetini tercih ediyoruz. Amazon DataZone ön izlemesindeki kullanım durumlarını doğruladık ve bunu sağlam bir iş veri kataloğu ve veri paylaşım iş akışı oluşturmak için kullanacağız. Ek iş yükü eklemeden ya da verileri kurum genelindeki tüm veri kullanıcılarımız için keşfedilebilir ve erişilebilir hale getirmek için oluşturduğumuz merkezi olmayan sahipliği engellemeden kimin hangi verileri hangi amaçlarla kullandığına dair tam görünürlük sağlayacak.”

—João Mota, Veri Platformu Başkanı, BTG Pactual

Çözüm adımları

Bir kuruluşun Amazon DataZone’u kullanmaya nasıl başlayabileceğine dair bir örnek verelim. Bu örnekte, veri üreticileri ve veri tüketicilerinin verilere yönetilen bir şekilde erişmesi, paylaşması ve tüketmesi için birleşik bir ortam oluşturuyoruz.

Ürünün benimsenmesi konusunda bir kampanya yürütmek isteyen bir ürün pazarlama ekibini ele alalım. Bu kampanyada başarılı olmak için bir veri ambarındaki müşteri verilerinden, veri gölündeki tıklama akışı verilerinden ve Salesforce gibi uygulamalardaki diğer kampanyaların performans verilerinden yararlanmak istiyorlar. Roberto bu verileri çok iyi bilen bir veri mühendisi. Şimdi Roberto’nun bu verileri kuruluştaki diğer kişiler için nasıl keşfedilebilir hale getireceğini görelim.

Şirketin yöneticisi, ekibin kullanması için “Pazarlama” adında bir etki alanı oluşturdu. Yönetici ayrıca, veri çalışanlarının verilerle çalışmak üzere ortamlar oluşturmasına olanak tanımak için “Blueprints” adı verilen bazı kaynak şablonları da oluşturdu. Yönetici ayrıca AWS Console dışında bir web uygulaması olan Amazon DataZone portalında kurumsal kimlik bilgilerini kullanarak oturum açabilecek kullanıcılar da ayarladı. Yönetici tüm AWS kaynaklarını kurar, böylece veri çalışanları teknik engellerle uğraşmak zorunda kalmaz.

Şimdi Roberto’nun katalogdaki verileri nasıl yayınlayabildiğinin ayrıntılarına bakalım.

  1. Roberto, kurumsal kimlik bilgilerini kullanarak Amazon DataZone portalında oturum açar.
  2. Verileri yayınlamak için kullanabileceği bir proje ve ortam oluşturur. Kataloglamak istediği veri kaynaklarını bildiğinden, tüm tıklama akışı verilerini içeren AWS Glue Catalog’a bir bağlantı oluşturur.
  3. Veri kaynağı çalıştırması için bir ad ve açıklama sağlar ve ardından veritabanlarını ve hangi tabloyu getirmek istediğine ilişkin ayrıntıları seçer.
  4. Teknik tablo ve sütun adları için makine öğrenimi tarafından oluşturulan iş adlarını almak üzere otomatik meta veri oluşturma seçeneğini seçer. Ardından, varlığı kaynakla senkronize tutmak için çalıştırmayı zamanlar.
  5. Birkaç dakika içinde tıklama akışı verileri ve tablo adları, şema ve diğer kaynak meta verileri gibi Amazon Redshift meta verilerinden alınan müşteri bilgileri Amazon DataZone’un envanterinde iyileştirme için hazır olur.
  6. Roberto artık Veronica, data analisti ve diğer veri çalışanlarının verileri anlamasını kolaylaştırmak için sözlük ve meta veri formlarını kullanarak ek iş bağlamı sağlamak üzere meta verileri zenginleştirebilir. Roberto, iş dünyasına uygun adları otomatik olarak tamamlamak için otomatik olarak oluşturulan önerileri kabul edebilir veya reddedebilir. Ayrıca söz konusu varlık için açıklamalar yapabilir, terimleri sınıflandırabilir ve diğer yararlı bilgileri sağlayabilir.
  7. İşlem tamamlandıktan sonra Roberto varlığı yayınlayabilir ve Amazon DataZone’daki veri tüketicilerinin kullanımına sunabilir.

Şimdi, pazarlama analisti Veronica’nın verileri keşfetmeye ve bu verilerle çalışmaya nasıl başlayabileceğine bir göz atalım.

  1. Veriler yayınlandığına ve katalogda mevcut olduğuna göre, Veronica kurumsal kimlik bilgilerini kullanarak Amazon DataZone portalında oturum açabilir ve veri aramaya başlayabilir. Aramaya “tıklama kampanyası” yazdığında ilgili tüm varlıklar döndürülür.
  2. Varlıkların çeşitli kaynaklardan ve bağlamlardan geldiğini fark eder. Sözlük terimleri ve veri kaynakları gibi unsurları kullanarak arama listesini düzenlemek için filtreler kullanır ve sonuçları alaka düzeyi ve zamana göre sıralar.
  3. Verilerle çalışmaya başlamak için yeni bir proje ve ihtiyaç duyduğu araçları sağlayan bir ortam oluşturması gerekecektir. Projenin oluşturulması, ekip arkadaşlarıyla iş birliği yapması için hızlı bir yol sağlar ve onlara veri ve araçlarla çalışmak için doğru düzeyde izinleri otomatik olarak sağlar.
  4. Veronica erişmesi gereken veriyi bulur. Şimdi veri yayıncısına veya sahibine verilere erişmesi gerektiğini bildirmek için Subscribe (Abone Ol) düğmesine tıklayarak erişim talebinde bulunur. Abone olurken, bu verilere neden erişmesi gerektiğine dair bir neden de sunar.
  5. Bu, Roberto’ya ve proje üyelerine birinin erişim aradığına dair bir bildirim gönderir ve onlar da kabul etmek veya reddetmek için talebi inceleyebilir. Robert portalda oturum açar, bildirimi görür ve nedeni çok açık olduğu için isteği onaylar.
  6. Onaylanan abonelikle birlikte Amazon DataZone Roberto adına bunu otomatik olarak yaptığı için Veronica da verilere erişebilir. Artık Veronica ve ekibi, kullanıcıların benimsemesini artıracak doğru kampanyayı bulmak için analizleri üzerinde çalışmaya başlayabilir.

Bu nedenle, tüm veri keşfi ve erişim yaşam döngüsü ve kullanımı Amazon DataZone üzerinden gerçekleşiyor. Verilerin nasıl paylaşıldığı, kimin kullandığı ve kimin yetkilendirdiği üzerinde tam görünürlük ve kontrol elde edersiniz. Esasen Amazon DataZone, kuruluşunuzun üyelerine her zaman istedikleri özgürlüğü, etrafında doğru yönetişimin güveniyle vermenizi sağlar.

İşte kullanıcıların analizleri için gerekli verileri kataloglamak, yayınlamak, keşfetmek, anlamak ve bunlara abone olmak için giriş yapabilecekleri Amazon DataZone portalının bir ekran görüntüsü.

Sonuç

Bu yazıda, zorlukları, temel yetenekleri ve birkaç yaygın kullanım örneğini ele aldık. Örnek bir senaryo ile nasıl başlayabileceğinizi gösterdik. Amazon DataZone artık genel kullanıma sunulmuştur. Daha fazla bilgi için Amazon DataZone’daki Yenilikler veya Amazon DataZone bölümüne bakın.

Amazon DataZone’un en son demolarından bazıları ve mevcut özelliklerin kısa açıklamaları için YouTube oynatma listesine göz atın.