Merhaba arkadaşlar ben Asterixs bu konumuzda veri bilimini işleyeceğiz.
Veri Bilimi
Çeşitli yöntemlerle elde edilen verileri analiz ederek daha açıklayıcı yapmak için istatistik, yapay zeka, bilimsel yöntemler ve veri analizi kullanılan bir alandır. Veri bilimi verileri analiz sürecine hazırlayan temizleme, toplama ve çözümleme gibi çeşitli işlemlemeleri de kapsıyor.
Veri Biliminin Geçmişi Ve Geleceği
İlk olarak 1960'larda istatistik sözcüğü için alternatif bir isim olarak ortaya çıkmıştır. 1990'ların sonlarında, bilgisayar bilimi uzmanları terimi resmileştirdi. Veri bilimi kavramının akademi dışında kullanımı ise 2000’lerin başı ile gerçekleşmeye başladı. Geleceğe ait umut vaadeden bir alandır. Yapay zeka ve makine öğrenimi alanındaki inovasyonlar, veri işleme süreçlerini daha hızlı ve verimli hale getirdi. Veri bilimi bu kadar kolaylık sağladığı için ilgi görmeye devam ediyor.
Veri Bilimi Niçin kullanılır
Veri bilimi açıksal , tanısal , tahmine dayalı ve kuralcı analiz olmak üzere 4 temel yol ile veriler üzerinde çalışmak için kullanılır.
Açıklayıcı analiz, gerçekleşen olaylara veya veri ortamında yaşananlara dair öngörü elde etmek için verileri inceler. Pasta grafikleri, çubuk grafikleri, çizgi grafikleri, tablolar gibi veri görselleştirmeleri ile oluşturulmuş açıklamalar içerir.
Tanısal analiz, bir şeyin neden gerçekleştiğini anlamak için yapılan derinlemesine irdeleme veya ayrıntılı veri incelemesidir. Ayrıntılara inme, veri keşfi, veri madenciliği ve bağıntılar gibi teknikler kullanılmaktadır.
Tahmine dayalı analiz, adından anlaşılacağı gibi geçmişteki verileri kullanarak gelecekte gerçekleşebilecek veri düzenleri hakkında isabetli tahminlerde bulunmaya çalışılır. Makine öğrenimi, tahminde bulunma, düzen eşleştirme ve tahmine dayalı modelleme gibi teknikler kullanılır.
Kuralcı analiz, tahmine dayalı verileri bir üst seviyeye çıkarır. Sadece gerçekleşmesi olası sonucu tahmin etmekle kalmaz bu sonuç için ideal yanıtı da önerir. Farklı seçimlerin getirebileceği potansiyel sonuçları analiz edebilir. Grafik analizini, simülasyonu, karmaşık olay işleme süreçlerini, sinir ağlarını ve makine öğreniminden öneri gibi yollar kullanır.
Veri Biliminin Kullanım Alanları
En çok kullanılan alanlardan birkaçına göz atalım.
Yapay zeka, bir bilgisayarın veya bilgisayar kontrollü robotun, genellikle akıllı varlıklarla ilişkili görevleri yerine getirmesidir. Mesela bilgisayarda oynanan satranç oyununu buna örnek verebiliriz.
Makine öğrenimi, kod yazmaya gerek kalmadan belirli bir veri kümesi hakkında ilginç şeyler söyleyebilen genel algoritmalar oluşturan bir daldır.
Veri Modelleme, veritabanında depolanacak veriler için bir veri modeli oluşturma sürecidir. Veri nesnelerinin, farklı veri nesneleri arasındaki ilişkilerin ve kuralların kavramsal bir temsilidir.
.
Veri madenciliği, veri analitiğinin bir dalı veya verilerdeki gizli veya önceden bilinmeyen kalıpları bulmak üzere kullanılan bir analiz türüdür.
Veri Bilimi Teknikleri
Veri bilimi teknikleri Sınıflandırma , Regresyon ve kümeleme olmak üzere üçe ayrılır
Sınıflandırma, verilerin belirli grup veya kategorilere tasnif edilmesidir. Bilgisayarlar, verileri belirlemek ve tasnif etmek üzere eğitilir. Bilinen veri kümeleri kullanılarak, bir bilgisayarda verileri hızlı bir şekilde işleyen ve kategorize eden karar algoritmaları oluşturulur. Bunlara ek olarak yatırımlar, sigorta veya kredi başvuruları risk oranlarına göre kategorize edilebiliyor.
Regresyon, alakasız görünen iki veri noktası arasında bir ilişki bulma yöntemidir. Bağlantı genellikle bir matematik formülü etrafında modellenir ve bir grafik ya da eğrilerle temsil edilir. Verilerden birinin değeri bilindiğinde diğer veri noktasını tahmin etmek için de regresyon tekniği kullanılır.
Kümeleme tekniği düzenleri veya anormallikleri bulmak için birbiriyle yakından ilişkili verileri gruplandırma yöntemidir. Kümeleme tekniği sınıflandırma tekniğinden farklı olarak verileri yalnızca sabit kategorilere bağlı olarak sınıflandırmamasıdır.