Veri bilimi nedir?

Veri bilimi, iş için anlamlı öngörüler ayıklamak amacıyla veriler üzerinde gerçekleştirilen çalışmaların adıdır. Büyük miktardaki verileri analiz etmek için matematik, istatistik, yapay zeka ve bilgisayar mühendisliği alanlarının ilke ve uygulamalarını bir araya getiren, disiplinler arası bir yaklaşımdır. Bu analiz, veri bilimcilerin ne oldu, neden oldu, ne olacak ve sonuçlarla neler yapılabilir sorularını sormasına ve cevaplamasına yardımcı olur.

Veri bilimi neden önemlidir?

Veri bilimi, verilerden anlam çıkartmak amacıyla çeşitli araç, yöntem ve teknolojileri bir araya getirdiği için önemlidir. Modern kuruluşlar adeta bir veri bombardımanı altında. Bilgileri otomatik olarak toplayabilen ve depolayabilen cihaz sayısı eskisinden çok daha fazla. Çevrimiçi sistemler ve ödeme portalları; e-ticaret, tıp, finans gibi alanlarda ve insan yaşamının diğer her alanında çok daha fazla veri yakalıyor. Devasa miktarda metin, ses, video ve görüntü verilerine erişebiliyoruz.  

Maalesef eyleme dönüştürülebilir olmadığı sürece ham veriler hiçbir değer sunmuyor. Veri bilimciler, ham verileri anlamlı önerilere dönüştürebilir. İşletmelerin varlığından dahi haberdar olmadığı sorunları ortaya çıkarabilir ve çözebilirler. Kuruluşlar da bu önerileri müşteri memnuniyetini artırmak, tedarik zincirini optimize etmek veya yeni ürünler çıkarmak için kullanabilir.

Veri biliminin geçmişi

Veri bilimi terimi yeni değildir ancak anlamları ve çağrışımları zaman içinde değişmiştir. Bu sözcük ilk olarak 60'larda istatistik sözcüğü için alternatif bir ad olarak ortaya çıkmıştır. 90'ların sonlarında, bilgisayar bilimi uzmanları terimi resmileştirdi. Önerilen tanım, veri bilimini verilerin tasarımı, toplanması ve analizi şeklinde üç farklı yönü bulunan ayrı bir alan olarak ifade ediyordu. Terimin akademik çevreler dışında kullanılmaya başlaması ise bundan yaklaşık on yıl sonra gerçekleşti. 

Veri biliminin geleceği

Yapay zeka ve makine öğrenimi alanındaki inovasyonlar, veri işleme süreçlerini daha hızlı ve verimli hale getirdi. Sektörün talebi doğrultusunda, veri bilimi alanındaki kursları, sertifikaları ve iş pozisyonlarını bünyesinde barındıran bir ekosistem ortaya çıktı. İhtiyaç duyulan işlevler arası beceri kümesi ve uzmanlık nedeniyle, veri biliminin önümüzdeki onlarca yıllık süreçte ciddi anlamda büyüyeceği öngörülüyor.

Veri bilimi ne için kullanılır?

Veri bilimi, dört temel yol izlenerek veriler üzerinde çalışmak için kullanılır:

1. Açıklayıcı analiz

Açıklayıcı analiz, gerçekleşen olaylara veya veri ortamında yaşananlara dair öngörü elde etmek için verileri inceler. Karakteristik özelliği; pasta grafikleri, çubuk grafikleri, çizgi grafikleri, tablolar gibi veri görselleştirmeleri veya oluşturulmuş açıklamalar içermesidir. Örneğin, bir uçuş rezervasyonu hizmeti, her gün rezerve edilen bilet sayısı gibi verileri kaydedebilir. Açıklayıcı analiz bu hizmet için ani rezervasyon artışlarını, ani rezervasyon düşüşlerini ve yüksek performanslı ayları ortaya çıkarır.

2. Tanısal analiz

Tanısal analiz, bir şeyin neden gerçekleştiğini anlamak için yapılan derinlemesine irdeleme veya ayrıntılı veri incelemesidir. Karakteristik özelliği; ayrıntılara inme, veri keşfi, veri madenciliği ve bağıntılar gibi tekniklerdir. Bu tekniklerin her birindeki benzersiz düzenleri keşfetmek için belirli bir veri kümesi üzerinde birden fazla veri işlemi veya dönüşümü uygulanabilir. Örneğin, uçuş hizmeti, yüksek performanslı bir ayın ayrıntılarına inebilir ve ani rezervasyon artışını daha iyi anlamaya çalışabilir. Bunun sonucunda, çok sayıda müşterinin ayda bir düzenlenen bir spor etkinliğine katılmak için o şehri ziyaret ettiği keşfedilebilir.

3. Tahmine dayalı analiz

Tahmine dayalı analiz, geçmişteki verileri kullanarak gelecekte gerçekleşebilecek veri düzenleri hakkında isabetli tahminlerde bulunur. Karakteristik özelliği; makine öğrenimi, tahminde bulunma, düzen eşleştirme ve tahmine dayalı modelleme gibi tekniklerdir. Bu tekniklerin her birinde bilgisayarlar verilerdeki nedensellik bağlantıları üzerinde ters mühendislik yapmak için eğitilir. Örneğin, uçuş hizmeti ekibi her yılın başında o yılın uçuş rezervasyonu düzenlerini tahmin etmek için veri biliminden yararlanabilir. Bilgisayar programı veya algoritması geçmişteki verilere bakabilir ve Mayıs ayında belirli destinasyonlarda yaşanacak olan ani rezervasyon artışlarını tahmin edebilir. Müşterilerinin gelecekteki seyahat ihtiyaçlarını öngörebilen şirket, o şehirler için hedeflemeli reklamları Şubat ayından itibaren başlatabilir.

4. Kuralcı analiz

Kuralcı analiz, tahmine dayalı verileri bir üst seviyeye çıkarır. Sadece gerçekleşmesi olası sonucu tahmin etmekle kalmayarak bu sonuç için ideal yanıtı da önerir. Farklı seçimlerin getirebileceği potansiyel sonuçları analiz edebilir ve en iyi eylem tarzını önerebilir. Grafik analizini, simülasyonu, karmaşık olay işleme süreçlerini, sinir ağlarını ve makine öğreniminden öneri altyapılarını kullanır.         
Uçuş rezervasyonu örneğine dönersek, kuralcı analiz geçmişteki pazarlama kampanyalarına bakarak yaklaşan ani rezervasyon artışından en iyi şekilde yararlanmayı sağlayabilir. Bir veri bilimci, farklı pazarlama kanallarındaki farklı pazarlama harcaması seviyelerinin getireceği rezervasyon sonuçlarını öngörebilir. Bu veri tahminleri, uçuş rezervasyonu şirketinin pazarlama kararlarını daha güvenle vermesine yardımcı olur.

Veri biliminin işletmeler için avantajları nelerdir?

Veri bilimi, işletmelerin çalışma biçiminde devrim yaratıyor. Büyüklüklerinden bağımsız olarak birçok işletme, büyümeyi hızlandırmak ve rekabet avantajını sürdürmek için sağlam bir veri bilimi stratejisine ihtiyaç duyar. Temel avantajlardan bazıları şunlardır:

Dönüşüm yaratabilecek bilinmeyen düzenleri keşfetme

Veri bilimi, işletmelere kuruluş çapında dönüşüm yaratma potansiyeline sahip yeni düzen ve ilişkileri keşfetme olanağı tanır. Kâr marjlarını önemli ölçüde etkileyebilecek düşük maliyetli kaynak yönetimi değişikliklerini ortaya çıkarabilir. Örneğin, bir e-ticaret şirketi, veri bilimini kullanarak müşterilerin çalışma saatlerinden sonra çok sayıda soru sorduğunu keşfediyor. Yapılan araştırmalar, sorduğu sorunun yanıtını ertesi iş günü yerine kısa süre içinde alan müşterilerin alışveriş yapma olasılığının daha yüksek olduğunu ortaya çıkarıyor. Bunun üzerine 7/24 müşteri hizmeti sunmaya başlayan işletme, bu sayede gelirini %30 artırıyor.

Yeni ürün ve çözümlerle inovasyon yapma

Veri bilimi, aksi takdirde fark edilmeyecek boşlukları ve sorunları ortaya çıkarabilir. Alışveriş kararları, müşteri geri bildirimleri ve iş süreçleri hakkında daha fazla öngörü, dahili operasyonlarda ve harici çözümlerde inovasyonu beraberinde getirebilir. Örneğin, bir çevrimiçi ödeme çözümü, veri bilimini kullanarak müşterilerin sosyal medyada şirket hakkında yaptığı yorumları harmanlıyor ve analiz ediyor. Yapılan analizler, müşterilerin yoğun alışveriş dönemlerinde parolalarını unuttuğunu ve mevcut parola alma sisteminden memnun olmadığını ortaya çıkarıyor. Şirket inovasyon yaparak daha iyi bir çözüm sunabilir ve müşteri memnuniyetinde önemli bir artış yakalayabilir.

Gerçek zamanlı optimizasyon

Büyük ölçekli kurumsal şirketler başta olmak üzere, işletmelerin değişen koşullara gerçek zamanlı olarak yanıt vermesi oldukça zordur. Bu da iş etkinliklerinde önemli kayıplara veya kesintilere yol açabilir. Veri bilimi, şirketlerin değişimi önceden tahmin etmesine ve farklı koşullara karşı ideal tepkiyi vermesine yardımcı olabilir. Örneğin, kamyonlarla hizmet veren bir nakliyat şirketi, veri bilimini kullanarak kamyonlar arıza yaptığında yaşanan kesinti sürelerini azaltmak istiyor. Daha hızlı arıza yaşanmasına yol açan rotaları ve vardiya düzenlerini belirliyorlar ve kamyonların zaman çizelgelerini buna göre ayarlıyorlar. Buna ek olarak, kamyonların daha hızlı tamir edilebilmesi için sık sık değişim gerektiren yaygın yedek parçaların envanterini hazırlıyorlar.  

Veri bilimi süreci nedir?

Veri bilimi süreci genellikle bir iş sorunu nedeniyle başlatılır. Bir veri bilimci, işletmenin ihtiyaçlarını anlamak için işletme paydaşlarıyla birlikte çalışır. Sorun tanımlandıktan sonra, veri bilimci bu sorunu OSEMN veri bilimi sürecini kullanarak çözebilir:

O - Obtain data (Verileri edinme)

Önceden var olan veriler, yeni elde edilen veriler veya internetten indirilen bir veri deposu kullanılabilir. Veri bilimciler dahili veya harici veritabanlarından, şirket CRM yazılımlarından, web sunucusu günlüklerinden veya sosyal medyadan veri ayıklayabilir ya da üçüncü taraf kaynaklardan veri satın alabilir.

S - Scrub data (Verileri ovma)

Veri ovma veya veri temizleme adıyla karşımıza çıkan bu süreç, verileri önceden belirlenen bir formata göre standart hale getirme sürecidir. Eksik verileri ele alma, veri hatalarını düzeltme ve aykırı verileri kaldırma adımlarını içerir. Bazı veri ovma örnekleri şunlardır:· 

  • Tüm tarih değerlerini ortak bir standarda dönüştürmek.  
  • İmla hatalarını veya gereksiz boşlukları düzeltmek.  
  • Matematik hatalarını düzeltmek veya büyük sayılardaki noktaları kaldırmak.

E - Explore data (Verileri keşfetme)

Veri keşfi, ileride uygulanacak veri modelleme stratejilerini planlarken kullanılan ön veri analizidir. Veri bilimciler, açıklayıcı istatistiklerden ve veri görselleştirme araçlarından yararlanarak verileri genel hatlarıyla anlamaya başlar. Bundan sonra, üzerinde çalışılabilecek veya eyleme dönüştürülebilecek ilgi çekici düzenleri belirlemek için verileri keşfetmeleri mümkün olur.      

M - Model data (Verileri modelleme)

Daha derin öngörüler edinmek, sonuçları tahmin etmek ve en iyi eylem tarzını belirlemek için yazılım ve makine öğrenimi algoritmaları kullanılır. Eğitim veri kümesine ilişkilendirme, sınıflandırma ve kümeleme gibi makine öğrenimi teknikleri uygulanır. İsabet oranını değerlendirmek amacıyla, model önceden belirlenen test verileriyle karşılaştırılarak test edilebilir. Sonuçların iyileştirilmesi amacıyla, veri modeli üzerinde üst üste defalarca hassas ayar yapılabilir. 

N - Interpret results (Sonuçları yorumlama)

Veri bilimciler, veri öngörülerini eyleme dönüştürmek için analistlerle ve işletmelerle birlikte çalışır. Trendleri ve tahminleri temsil eden diyagramlar, grafikler ve çizelgeler oluşturur. Verilerin özetlenmesi, paydaşların sonuçları etkili bir şekilde anlamasına ve uygulamasına yardımcı olur.

Veri bilimi teknikleri nelerdir?

Veri bilimi uzmanları, veri bilimi sürecini izlemek için bilgi işlem sistemleri oluşturur. Veri bilimciler tarafından kullanılan başlıca teknikler şunlardır:

Sınıflandırma

Sınıflandırma, verilerin belirli grup veya kategorilere tasnif edilmesidir. Bilgisayarlar, verileri belirlemek ve tasnif etmek üzere eğitilir. Bilinen veri kümeleri kullanılarak, bir bilgisayarda verileri hızlı bir şekilde işleyen ve kategorize eden karar algoritmaları oluşturulur. Örneğin:  

  • Ürünleri popüler veya popüler değil olarak tasnif etme  
  • Sigorta başvurularını yüksek riskli veya düşük riskli olarak tasnif etme  
  • Sosyal medya yorumlarını olumlu, olumsuz veya nötr olarak tasnif etme.

Veri bilimi uzmanları, veri bilimi sürecini izlemek için bilgi işlem sistemleri oluşturur. 

Regresyon

Regresyon, alakasız görünen iki veri noktası arasında bir ilişki bulma yöntemidir. Bağlantı genellikle bir matematik formülü etrafında modellenir ve bir grafik ya da eğriler olarak temsil edilir. Veri noktalarından birinin değeri bilindiğinde, diğer veri noktasını tahmin etmek için regresyon kullanılır. Örneğin:  

  • Hava yoluyla bulaşan hastalıkların yayılma hızı. 
  •  Müşteri memnuniyeti ile çalışan sayısı arasındaki ilişki.  
  • Belirli bir konumda itfaiye istasyonlarının sayısı ile yangından kaynaklanan yaralanma sayısı arasındaki ilişki. 

Kümeleme

Kümeleme, düzenleri veya anormallikleri bulmak amacıyla, birbiriyle yakından ilişkili verileri gruplandırma yöntemidir. Kümelemenin tasnif etmeden farkı, verilerin sabit kategorilere isabetli bir şekilde sınıflandırılamamasıdır. Bu nedenle veriler, en olası ilişkileri göz önünde bulundurularak gruplandırılır. Kümeleme sayesinde yeni düzenler ve ilişkiler keşfedilebilir. Örneğin:  
  • Daha iyi müşteri hizmeti sunmak amacıyla, benzer alışveriş davranışları sergileyen müşterileri gruplandırma.  
  • Günlük kullanım düzenlerini belirlemek ve bir ağ saldırısını daha hızlı tespit etmek için ağ trafiğini gruplandırma.  
  • Makaleleri farklı haber kategorileri altında kümeleme ve bu bilgileri asılsız haber içeriklerini bulmak üzere kullanma.

Veri bilimi tekniklerinin ardındaki temel ilke

Ayrıntılar değişiklik gösterebilmekle birlikte, bu tekniklerin altında yatan ilkeler şunlardır:
  • Bir makineye, bilinen bir veri kümesine dayalı olarak verileri nasıl tasnif edeceğini öğretmek. Örneğin, bilgisayara örnek anahtar sözcükler ve her birinin tasnif değeri verilir. "Mutluluk" olumlu, "Nefret" ise olumsuzdur.
  • Makineye bilinmeyen verileri vermek ve cihaza veri kümesini bağımsız bir şekilde tasnif ettirmek.
  •  Sonuçlardan bazılarının isabetsiz olacağı bilinciyle hareket etmek ve sonucun olasılık faktörünü ele almak.  

Farklı veri bilimi teknolojileri nelerdir?

Veri bilimi uygulayıcıları, şunun gibi karmaşık teknolojilerle çalışır:

  1. Yapay zeka: Tahmine dayalı ve kuralcı analiz için makine öğrenimi modelleri ve ilgili yazılımlar kullanılır.
  2. Bulut bilgi işlem: Bulut teknolojileri, veri bilimcilere gelişmiş veri analizleri için ihtiyaç duydukları esnekliği ve işlem gücünü vermiştir.
  3. IoT (Nesnelerin İnterneti): IoT, internete otomatik olarak bağlanabilen çeşitli cihazları ifade eder. Bu cihazlar, veri bilimi girişimleri için veri toplar. Bunlar, veri madenciliği ve veri ayıklama için kullanılabilen, devasa boyutta veriler oluşturmaktadır.
  4. Kuantum bilgi işlem: Kuantum bilgisayarları, karmaşık hesaplamaları yüksek hızla yapabilir. Gerekli becerilere sahip veri bilimciler, karmaşık nicel algoritmalar oluşturmak için bunları kullanabilir.

Veri bilimi, veriyle ilgili diğer rol ve alanların tamamını kapsayan bir terimdir. Bunlardan bazılarına göz atalım:

Veri bilimi ile veri analizi arasındaki fark nedir?

Bu terimler bazen birbirinin yerine kullanılmakla birlikte, veri analizi aslında veri biliminin bir alt kümesidir. Veri bilimi, toplamadan modellemeye ve öngörülere kadar tüm veri işleme adımlarını kapsayan bir çatı terimdir. Öte yandan veri analizi, temelde istatistik, matematik ve istatistiksel analiz alanlarıyla ilgilenir. Veri bilimi ise sadece veri analizine değil, kuruluş verilerinin çizdiği büyük resme odaklanır. Çoğu iş yerinde veri bilimciler ve veri analistleri, ortak iş hedefleri doğrultusunda birlikte çalışır. Bir veri analisti zamanının daha büyük bir bölümünü rutin analizlere harcayarak düzenli raporlar sağlayabilir. Bir veri bilimci verilerin depolanma, değiştirilme ve analiz edilme biçimini tasarlayabilir. Kısaca bir veri analisti mevcut verileri anlamlı hale getirirken, bir veri bilimci ise analistlerin kullanacağı verilerin işlenmesi için yeni yöntem ve araçlar oluşturur.

Veri bilimi ile iş analizi arasındaki fark nedir?

Veri bilimi ile iş analizi kısmen örtüşmekle birlikte, temel fark alanlardaki teknoloji kullanımıdır. İş analistleriyle kıyaslandığında, veri bilimciler veri teknolojisiyle daha yakından çalışır. İş analistleri ise iş ile BT arasındaki boşluğu doldurur. İş vakalarını tanımlar, paydaşlardan bilgi toplar veya çözümleri doğrularlar. Öte yandan veri bilimciler, iş verileriyle çalışmak için teknolojiden yararlanır. Programlar yazabilir, modeller oluşturmak için makine öğrenimi teknikleri uygulayabilir ve yeni algoritmalar geliştirebilirler. Veri bilimciler sadece sorunu anlamakla kalmaz, aynı zamanda soruna çözüm getiren bir araç oluşturabilir. İş analistlerinin ve veri bilimcilerin aynı ekipte çalışması, zaman zaman karşılaşılan bir durumdur. İş analistleri, veri bilimcilerin ürettiği çıktıyı alarak bunu tüm işletmenin anlayabileceği bir hikayeye dönüştürür.

Veri bilimi ile veri mühendisliği arasındaki fark nedir?

Veri mühendisleri, veri bilimcilerin verilere erişmesine ve verileri yorumlamasına olanak tanıyan sistemleri oluşturur ve bu sistemlerin bakımını yapar. Bir veri bilimciye kıyasla, altta yatan teknolojiyle daha yakından çalışır. Bu roldeki kişiler genellikle veri modelleri oluşturur, veri işlem hatları inşa eder ve ayıklama, dönüştürme, yükleme (ETL) süreçlerini gözetim altında tutar. Veri mühendisi, kuruluşun yapısına ve büyüklüğüne bağlı olarak büyük veri depolama, akış ve işleme platformları (ör. Amazon S3) gibi ilgili altyapıyı da yönetebilir. Veri bilimciler, tahmine dayalı modeller oluşturmak ve eğitmek için veri mühendislerinin işlediği verileri kullanır. Sonrasında veri bilimciler, yeni kararların alınabilmesi için sonuçları analistlere verebilir.

Veri bilimi ile makine öğrenimi arasındaki fark nedir?

Makine öğrenimi, makineleri insanların yaptığı biçimde verileri analiz etmeleri ve bu verilerden ders çıkarmaları için eğitme bilimidir. Veri bilimi projelerinde verilerden otomatik öngörüler edinirken kullanılan yöntemlerden biridir. Makine öğrenimi mühendisleri bilgi işlemde, algoritmalarda ve makine öğrenimi yöntemlerine özgü kodlama becerilerinde uzmanlaşır. Veri bilimciler verileri işlemek için makine öğrenimi yöntemlerini birer araç olarak kullanabilir veya diğer makine öğrenimi mühendisleriyle yakından çalışabilir.

Veri bilimi ile istatistik arasındaki fark nedir? 

İstatistik, nicel verileri toplamayı ve yorumlamayı amaçlayan, matematiğe dayalı bir alandır. Veri bilimi ise çeşitli biçimlerdeki verilerden bilgi ayıklamak için bilimsel yöntem, süreç ve sistemleri kullanan, çok disiplinli bir alandır. Veri bilimciler, istatistik dahil olmak üzere birçok farklı disiplinden yöntemler kullanır. Ancak bu alanların kullandığı süreçler ve üzerinde çalıştığı sorunlar farklıdır.  

Farklı veri bilimi araçları nelerdir?

AWS, dünyanın dört bir yanındaki veri bilimcileri destekleyen çeşitli araçlar sunar:

Veri depolama

Veri ambarı söz konusu olduğunda Amazon Redshift, yapılandırılmış veya yapılandırılmamış veriler üzerinde karmaşık sorgular çalıştırabilir. Analistler ve veri bilimciler, verileri yönetmek ve aramak için AWS Glue'yu kullanabilir. AWS Glue, bir data lake içerisindeki tüm veriler için otomatik olarak birleşik bir katalog oluşturur ve keşfedilebilir olmaları için meta verileri ekler.

Makine öğrenimi

Amazon SageMaker, Amazon Elastic Compute Cloud (EC2) üzerinde çalışan ve tam olarak yönetilen bir makine öğrenimi hizmetidir. Kullanıcılara verileri düzenleme; makine öğrenimi modelleri oluşturma, eğitme ve dağıtma; ayrıca operasyonları ölçeklendirme olanağı sunar.

Analiz

  •  Amazon Athena, Amazon S3'te veya Glacier'da verileri analiz etmenizi kolaylaştıran etkileşimli bir sorgu hizmetidir. Hızlı ve sunucusuz olmasının yanında, standart SQL sorgularıyla çalışır.
  • Amazon Elastic MapReduce (EMR), Spark ve Hadoop gibi sunucular kullanarak büyük verileri işler.
  • Amazon Kinesis, akış verilerin gerçek zamanlı olarak toplanmasına ve işlenmesine olanak tanır. Web sitesi tıklama akışlarını, uygulama günlüklerini ve IoT cihazlarından gelen telemetri verilerini kullanır. 
  • Amazon OpenSearch, petabaytlarca veri üzerinde arama, analiz ve görselleştirme yapmaya olanak tanır.

Bir veri bilimci ne yapar?

Bir veri bilimci, veri bilimi süreci kapsamında geniş bir yelpazedeki farklı teknik, araç ve teknolojileri kullanabilir. Daha hızlı ve daha isabetli sonuçlar için soruna en uygun kombinasyonları seçer.

Bir veri bilimcinin rolü ve gündelik işleri, kuruluşun büyüklüğüne ve gerekliliklerine bağlı olarak değişir. Genellikle hepsi veri bilimi sürecini izler ancak ayrıntılar farklılık gösterebilir. Büyük veri bilimi ekiplerinde bir veri bilimci, veri bilimi süreçlerinin uçtan uca izlendiğinden ve iş hedeflerine ulaşıldığından emin olmak için diğer analistlerle, mühendislerle, makine öğrenimi uzmanlarıyla ve istatistikçilerle birlikte çalışabilir. 

Ancak küçük ekiplerde bir veri bilimci, birçok farklı görevi üstlenebilir. Deneyimine, becerilerine ve eğitim geçmişine dayalı olarak birden fazla rolü veya çakışan rolleri yerine getirebilir. Bu durumda, günlük sorumlulukları arasında temel veri bilimi metodolojilerinin yanı sıra mühendislik, analiz ve makine öğrenimi de yer alabilir. 

Veri bilimcilerin karşılaştığı zorluklar nelerdir?

Birden fazla veri kaynağı

Farklı türdeki uygulama ve araçlar, çeşitli formatlarda veriler oluşturur. Veri bilimciler, tutarlı hale getirmek için verileri temizlemek ve hazırlamak zorundadır. Bu bazen son derece zahmetli ve zaman alan bir iştir.

İş sorununu anlama

Veri bilimciler, çözülecek sorunu tanımlamak için birden fazla paydaşla ve işletme yöneticisiyle birlikte çalışmak zorundadır. Bu da özellikle farklı gereklilikleri olan birden fazla ekibe sahip büyük şirketlerde zorlayıcı olabilmektedir.

Yanılgıları ortadan kaldırma

Makine öğrenimi tam anlamıyla isabetli değildir ve sonuç olarak bir miktar belirsizlik veya yanılgı ortaya çıkabilir. Yanılgılar, eğitim verilerinde veya farklı gruplarda (ör. yaş ya da gelir aralığı) modelin tahmin davranışında yaşanan dengesizliklerdir. Örneğin, öncelikli olarak orta yaşlı bireylerden elde edilen veriler üzerinde eğitilen bir araç, daha genç ve daha yaşlı kişilerle ilgili tahminlerde bulunurken daha isabetsiz olabilir. Makine öğrenimi alanı, yanılgıları saptayarak ve hem veri hem de model içerisinde ölçerek bunları giderme fırsatı sağlar.

Veri bilimi için sonraki adımlar

Standard Product Icons (Features) Squid Ink
Ürünlerle ilgili diğer kaynaklara göz atın
Data lake'ler ve analiz hakkında daha fazla bilgi edinin 
Sign up for a free account
Ücretsiz bir hesap için kaydolun

AWS Ücretsiz Kullanım için anında erişim elde edin. 

Kaydolun 
Standard Product Icons (Start Building) Squid Ink
Konsolda oluşturmaya başlayın

AWS Management Console'da AWS ile oluşturmaya başlayın.

Oturum açın