Özellik mühendisliği nedir?

Model özellikleri, makine öğrenimi (ML) modellerinin tahminde bulunmak için eğitim ve çıkarım sırasında kullandığı girdilerdir. ML modelinin doğruluğu, kesin bir özellikler kümesine ve birleşimine dayalıdır. Örneğin, müzik oynatma listesi öneren bir ML uygulamasındaki özellikler şarkı puanlarını, önceden hangi şarkıların dinlendiğini ve şarkı dinleme süresini içerebilir. Özellikleri oluşturmak, önemli ölçüde mühendislik çalışması gerektirebilir. Özellik mühendisliği, özellikleri eğitim ve tahmin için kullanabilmeniz amacıyla fiyat listeleri, ürün açıklamaları ve satış hacimleri gibi ham verilerden değişkenleri çıkarma ve dönüştürme süreçlerini içerir. Özellikleri geliştirmek için gereken adımlar arasında, veri ayıklama ve temizleme, ardından özellik oluşturma ve depolama yer alır.  

Özellik mühendisliğinin zorlukları nelerdir?

Özellik mühendisliği; veri analizi, iş alanı bilgisi ve sezgi becerisinin bir birleşimini içerdiğinden zordur. Özellikler oluştururken anında kullanılabilir verilere gitmek caziptir ancak genellikle uzmanlarla konuşmak, beyin fırtınası yapmak ve üçüncü taraf araştırmalar gerçekleştirmek aracılığıyla hangi verilerin gerekli olduğunu dikkate alarak başlamanız gerekir. Bu egzersizi tamamlamazsanız tahmine yönelik önemli değişkenleri gözden kaçırabilirsiniz.

Veri ayıklama

Veri toplama, ML için ihtiyacınız olan tüm verileri birleştirme sürecidir. Veriler dizüstü bilgisayarlar, veri ambarları, bulut, uygulamalar ve cihazlar dâhil birçok veri kaynağında barındığından veri toplama işlemi zahmetli olabilir. Bu farklı veri kaynaklarına bağlanmaya yönelik yollar bulmak zor olabilir. Veri hacimleri de katlanarak arttığından arama yapmak için birçok veri bulunur. Ek olarak veriler kaynağa bağlı olarak çok farklı formatlara ve türlere sahiptir. Örneğin, video verilerinin ve tablo verilerinin birlikte kullanılması kolay değildir.

Özellik oluşturma

Veri etiketleme bir ML modelinin öğrenebileceği bir bağlam sağlamak için ham verileri (görüntüler, metin dosyaları, videolar gibi) tanımlama ve bu verilere bir veya daha fazla anlamlı ve bilgilendirici etiket ekleme işlemidir. Örneğin, etiketler bir fotoğrafta kuş mu yoksa araba mı olduğunu, bir ses kaydında hangi kelimelerin söylendiğini veya bir röntgen filminde bir düzensizliğin fark edilip edilmediğini belirtebilir. Veri etiketleme; görüntü işleme, doğal dil işleme ve konuşma tanıma da dahil çeşitli kullanımlar için gereklidir.

Özellik depolama

Veriler temizlendikten ve etiketlendikten sonra ML ekipleri, doğru ve ML için hazır olduğundan emin olmak için verileri sıklıkla inceler. Çubuk grafikler, serpme diyagramları, kutu grafikleri, çizelgeler ve sütun grafikler gibi görselleştirmeler, verilerin doğru olduğunu doğrulamak için faydalı araçlardır. Ayrıca görselleştirmeler, veri bilimi ekiplerinin keşif amaçlı veri analizini tamamlamasına yardımcı olur. Bu süreç; desenleri keşfetmek, anomalileri tespit etmek, hipotezleri test etmek veya tahminleri kontrol etmek için görselleştirmeler kullanır. Keşif amaçlı veri analizi biçimsel modelleme gerektirmez; onun yerine veri bilimi ekipleri, verileri deşifre etmek için görselleştirmeler kullanabilir. 

AWS, özellik mühendisliğine nasıl yardımcı olabilir?

Amazon SageMaker Data Wrangler'da tek bir görsel arabirim kullanarak özellik mühendisliği sürecini basitleştirebilirsiniz. SageMaker Data Wrangler'ın veri seçme aracını kullanarak istediğiniz ham verileri çeşitli veri kaynaklarından seçebilir ve tek bir tıklamayla içeri aktarabilirsiniz. SageMaker Data Wrangler, hiçbir kod yazmanıza gerek kalmadan özellikleri standartlaştırabilmeniz, dönüştürebilmeniz ve birleştirebilmeniz için yerleşik 300 veri dönüşümü içerir. Verileriniz hazırlandıktan sonra Amazon SageMaker İşlem Hatları ile tamamen otomatik ML iş akışları oluşturabilir ve bunları yeniden kullanmak için Amazon SageMaker Özellik Mağazası'na kaydedebilirsiniz. SageMaker Özellik Mağazası; adlandırma, düzenleme ve ekipler genelinde kullanımın daha kolay olması için özellikleri depolayabileceğiniz ve bunlara erişebileceğiniz, amaca özel tasarlanmış bir depodur. SageMaker Özellik Mağazası, eğitim ve gerçek zamanlı çıkarım sırasında, ilave kod yazmaya veya özelliklerin tutarlı olması için manuel süreçler oluşturmaya gerek kalmadan, özellikler için birleşik bir depo sunar.

AWS ile özellik mühendisliği için sonraki adımları

Sign up for a free account
Ücretsiz bir hesap için kaydolun

AWS Ücretsiz Kullanım için anında erişim elde edin.

Kaydolun 
Standard Product Icons (Start Building) Squid Ink
Konsolda oluşturmaya başlayın

AWS Management Console'da makine öğrenimi ile oluşturmaya başlayın.

Oturum açın