Veri kataloğu nedir?

Veri kataloğu, bir kuruluşun topladığı ve işlediği tüm verilerin envanteridir. Yasal gereklilikler, kuruluşların veri toplamadan veri tüketim sürecine kadar daima veri güvenliğini sağlamasını ve verileri korumasını zorunlu kılar. Veri kataloğu, yönetişimi ve veri keşfini desteklemek için verileri düzenler ve sınıflandırır. Herkesin bir kuruluş içinde belirli bir veri kümesinin neden ve nasıl kullanıldığını hızlı bir şekilde anlayabilmesi nedeniyle bağlam paylaşımı yoluyla operasyonel verimliliği kolaylaştırır.

Veri kataloğunun avantajları nelerdir?

Kurumsal bir araç olarak veri kataloğu, verileri aramayı ve ne için kullandığınızı belirlemeyi kolaylaştırır. Aşağıda bazı avantajlarını bulabilirsiniz.

Hızlı varlık keşfi

Veri kataloğu, verileri tanımlama sürecini basitleştirerek çalışanların üretkenliğini artırmaya yardımcı olur. Daha sonra, ilgili verileri hızlı bir şekilde keşfetmek ve her veri kümesinin bağlamını ve amacını anlamak için açıklayıcı etiketler kullanarak verileri arayabilirsiniz. Verilerin nereden geldiğine, sistemlerde nasıl hareket ettiğine ve nasıl dönüştürüldüğüne dair bir görünüm sunar.  Veri analistleri genellikle analizlerini BT'ye yoğun bir şekilde bağlı kalmadan yürütebilir ve bu da hızlı öngörüler edinmeyi mümkün kılar.

Gelişmiş veri kalitesi

Veri katalogları, bir şirket yeni veriler aldığında çalışanların tamamlaması gereken birkaç alan gerektirir. Kullanıcıların kataloğa eriştiklerinde verilerin kökenlerini, dönüşüm süreçlerini ve düzenleme tarihlerini okuyabilmeleri, bilgilerle etkileşime girerken daha özgüvenli hissetmelerini sağlar. Yüksek düzeyde eksiksiz olması, veri yönetişiminin kolaylığını artırmaya ve veri kalitesini iyileştirmeye yardımcı olur. İşletmeler ayrıca daha az çabayla kapsamlı veri katalogları sağlamak için bu veri kataloğu meta verilerinin oluşturulmasını otomatikleştirebilir. 

Artan verimlilik

Bir veri kataloğu; adlandırma, tanımlar ve ölçümlerde tutarlılığı destekleyerek kuruluş içindeki farklı ekiplerin verileri anlama ve kullanma konusunda uyumlu olmasını sağlar. Kuruluşlar, tüm veri varlıklarına yönelik görünürlük sayesinde, veri yedekliliğini azaltarak aynı çalışmaların tekrarlanmamasını ve depolama maliyetlerinin en aza indirilmesini sağlayabilir. Veri bilimcilerinin deneyimlediği üretkenlik kazanımları, genel maliyetlerin düşürülmesine de yardımcı olur.

Gelişmiş güvenlik

Gizlilik düzenlemeleri, kuruluşların kişisel verilerin nerede bulunduğunu ve bunlara kimin eriştiğini bilmelerini gerektirir. Bir veri kataloğu, hassas verilerin doğru bir şekilde işlenmesini ve erişimin uygun şekilde verilmesini sağlamaya yardımcı olabilir. Kuruluşlar, verilerinin nereden geldiğini, nasıl kullanıldığını ve bunlara kimin eriştiğini izleyebilir ve böylece yasal uyumluluk girişimlerini geliştirebilir. 

Veri kataloğunun kullanım örnekleri nelerdir?

Kuruluşlar, depolama ve veri yönetimlerini kolaylaştırmak için veri kataloglarını kullanabilir. Aşağıda bir veri kataloğunun kullanım durumlarından bazıları verilmiştir.

Self servis analiz

Veri kataloğu, hangi verileri içerdiğine ve bir işletmenin bunları ne için kullandığına dair ayrıntılı bir açıklama sağlar. Ayrıca işletmelerin birçok benzer veri parçasını ayırt etmesine ve özellikle kurumsal ortamlarda veri alma ve kullanma ile ilgili her türlü süreci hızlandırmasına olanak tanır. Bu gelişmiş şeffaflık, kullanıcıların hangi verilere baktıklarını hızlı bir şekilde belirlemelerine ve gerekli tüm bilgileri tek bir konumda keşfetmelerine olanak tanır. Depolamada büyük veri hacimleri olsa bile teknik olmayan veri kullanıcıları için self servis analiz iş akışları oluşturabilirsiniz.

Bilgi paylaşımı

İş birliği, verilerden eyleme geçirilebilir ayrıntılı bilgiler elde etmenin anahtarıdır. Bir veri kataloğu, kullanıcıların veri kümeleri hakkında yorum yapmasına, bunları derecelendirmesine ve gözden geçirmesine olanak sağlayarak iş birliğine dayalı bir ortamı teşvik eder. Kullanıcılar, belirli veri kümeleri hakkındaki deneyimlerini ve bilgilerini paylaşarak riskleri azaltmak ve kuruluş genelinde analizi hızlandırmak için birlikte çalışabilir.

Veri köken analizi

Verilerin nereden geldiğini ve çeşitli sistemlerden nasıl geçtiğini anlamak; veri sorunlarını gidermek, etki analizleri yapmak veya uygunluk standartlarını karşılamak için kritik öneme sahiptir. Bir veri kataloğu, veri kökenine ilişkin görünürlük sağlayarak kullanıcılara verilerin kaynağından nihai hedefine doğru yolculuğunun net bir görüntüsünü sağlar. İşletmeler, tüm çalışanların tüm veri varlıklarının doğru adlarını anlamasına olanak tanıyan dahili sınıflandırma belgeleri oluşturabilir. Bir veri kataloğunda bir referans belgesine veya sayfaya sahip olmak, kuruluş genelinde veri tutarlılığını artırır.

Bir veri kataloğu hangi bilgileri içerir?

Veri katalogları, veri varlıkları envanterinizi tanımlamak ve hangi verileri içerdiği hakkında ek bilgi sunmak için meta veriler içerir. Meta veri alanları, veriler arasında hızlı bir şekilde arama yapmanıza ve varlıkları bulmanıza olanak tanır. Bir veri kataloğu, aşağıdaki örnekler gibi bir dizi meta veri içerebilir.

İşletme meta verileri

İşletme meta verileri, bir işletmeye sağladığı değerle ilgili herhangi bir bilgidir. Verilerin bir işletmede kullanımı, mevzuata uygunluk ayrıntıları ve diğer kullanıcılar için yararlı iş bağlamı hakkında bilgiler içerebilir. Örneğin, veri gizliliği seviyeleri, açıklamalar, konum, kullanıcılar, departman ve daha fazlası gibi veri projesi ek açıklamaları içerebilir. Bir kuruluş tipik olarak ihtiyaç duydukları iş verilerini tam olarak tanımlar ve birkaç ilgili alanı içerir.

Teknik meta veriler

Teknik meta veriler, bir veri kümesinin genel yapısını tanımlar. İlişkileri, bağlantıları, dizinler, satırlar, sütunlar ve tablo biçimi hakkında yorum yaparak veri nesnelerinin yapısını açıklar. Bu meta veriler ayrıca veri uzmanlarına, dönüşümden geçme ve analize girme gibi verilerin geçmesi gereken süreçler hakkında bağlam sağlar. Kullanıcılar, bir kuruluşun bilgileri nasıl organize ettiğini ve görüntülediğini hızla anlar. 

Operasyonel meta veriler

Operasyonel meta veriler, verilerin kaynağı ve dönüşümü, güncellemeleri, kardinalitesi ve diğer süreç tanımlama işaretçileri hakkında yorumlar sağlar. Operasyonel meta verileri kullanarak, verilerin kuruluşunuza nasıl girdiğini, hangi dönüşümden geçtiğini ve diğer güncel durum güncellemelerini görebilirsiniz. Operasyonel meta veri alanlarıyla, kullanıcıların verileri en son ne zaman düzenlediğini ve kimlerin verileri düzenleme iznine sahip olduğunu görebilirsiniz.

Bir veri kataloğunun temel özellikleri nelerdir?

Modern veri kataloğu platformları, kullanımlarını kolaylaştırmak ve verimliliği artırmak için çeşitli temel özellikler kullanır. 

Automation

Otomasyon, işletmelerin veri kataloglarını daha az çabayla yönetmelerini sağlar. Entegrasyon özellikleri, kataloğun çeşitli kaynaklardan otomatik olarak meta verileri almasını sağlar. Yeni veri varlıkları eklendiğinde veya mevcut olanlar güncellendiğinde katalog güncel kalır. Ayrıca bazı gelişmiş sistemler, zaman içinde veri sınıflandırma süreçlerini iyileştirmek ve düzenlemek için makine öğreniminden yararlanır. Veri kataloğundaki otomasyon özellikleri, sürekli artan veri hacimlerine rağmen çevikliği artırır.

Etkili arama seçenekleri

Veri kataloğu arama özellikleri, öneriler sağlamak için temel anahtar kelime aramalarının ötesine geçer. Ayrıca kullanıcıların verileri çeşitli kriterlere göre bulabilmeleri için filtreler içerirler. Kullanıcı deneyimi; alakalı, sıralı ve erişilmesi hızlı sonuçlar sağlaması açısından modern arama motorlarına benzer. Veri alımındaki verimlilik, veri keşfini ve araştırmayı teşvik ederken zamandan tasarruf sağlar. 

Evrensel sözlük

Evrensel sözlük, bir kuruluş genelinde terimler ve ölçümler için standartlaştırılmış tanımlar sunar. Tüm meta veri terimlerinin tek ve net bir tanıma sahip olmasını sağlar. Kullanıcılar katalogda bir terimle karşılaştıklarında, anlamı için sözlüğe başvurabilir ve tüm alanlarda tutarlı bir anlam ve kullanım sağlarlar. Bu, veri bütünlüğünü korumak ve farklı ekipler arasında net iletişimi teşvik etmek için özellikle önemlidir.

Veri yönetişimi ve veri kataloğu arasındaki fark nedir?

Veri yönetişimi, iş girişimlerini ve operasyonlarını desteklemek için verilerin uygun durumda olmasını sağlayan bir metodolojidir. ​Doğru yönetişimi kurmak, veri erişimi ve kontrolü arasında denge temin etmek ve denemeler yapılmasını teşvik ederken insanlara güven ve özgüven sağlamak anlamına gelir. İnsanlara, kurumsal verileri ve teknolojiyi kullanırken takip edebilecekleri bir çerçeve sunar. Veri yönetişimi, yüksek veri kalitesi ve yasal kısıtlamalar altında uygun kullanım sağlamak için yararlıdır.

Veri katalogları, veri yönetişimi politikalarını uygulamak için kullanılan bir teknolojidir. Veri yönetişimi, veri kullanım ilkeleri tanımlarken veri katalogları bunları uygular. Bu kataloglar, işletmelerin veri yönetişimlerini daha etkili bir şekilde takip etmelerini sağlar. 

AWS, veri kataloğu gereksinimlerinizi nasıl destekleyebilir?

AWS Glue; analiz, makine öğrenimi (ML) ve uygulama geliştirme için birden fazla kaynaktan gelen verileri keşfetmeyi, hazırlamayı, taşımayı ve entegre etmeyi kolaylaştıran sunucusuz bir veri entegrasyonu hizmetidir. AWS Glue Veri Kataloğu, tüm veri varlıklarınız için yapısal ve operasyonel meta verilerin depolanabileceği merkezi bir depodur. Belirli bir veri kümesinin tablo tanımını ve fiziksel konumunu depolayabilir, işle ilgili öznitelikler ekleyebilir ve bu verilerin zaman içinde nasıl değiştiğini izleyebilirsiniz.

Veri Kataloğu ayrıca Amazon Athena, Amazon EMR ve Amazon Redshift Spectrum ile entegre olur. Tablo tanımlarınızı Veri Kataloğu'na ekledikten sonra bu hizmetler arasında verilerinizin ortak bir görünümüne sahip olabilirsiniz.

AWS Glue, Veri Kataloğu'na meta verileri doldurmanın sayısız yolunu sunar. Örneğin, şunları yapabilirsiniz:

  • Çeşitli veri depolarını taramak; şemaları, bölüm yapısını otomatik olarak çıkarmak ve Veri Kataloğu'nu ilgili tablo tanımları ve istatistiklerle doldurmak için AWS Glue gezginlerini ayarlayın.
  • Meta verilerinizin her zaman güncel ve temel verilerle senkronize olması için gezginleri periyodik olarak çalışacak şekilde planlayın. 
  • AWS Glue konsolunu kullanarak veya API'yi çağırarak tablo ayrıntılarını manuel olarak ekleyin ve güncelleyin. 

Hemen ücretsiz bir hesap oluşturarak AWS'de veri kataloglarını kullanmaya başlayın.

AWS'de Sonraki Adımlar

Ürünle ilgili diğer kaynaklara göz atın
Yönetim ve yönetişim hizmetleri hakkında bilgi edinin 
Ücretsiz bir hesap için kaydolun

AWS Ücretsiz Kullanım için anında erişim elde edin.

Kaydolun 
Konsolda oluşturmaya başlayın

AWS Yönetim Konsolu'nda oluşturmaya başlayın.

Oturum açın