Veri Madenciliği Nedir?
1983 yılında Michael C. Lovell tarafından içinde ilk kez ”veri madenciliği” geçen bir makale yayınlamıştır. Veri madenciliği, verileri anlamlandırmak ve anlam kazandırmak amacıyla yapılan işleme verilen bir isimdir. Detaylı açıklamak gerekirse çok fazla veriden anlam çıkarabilmek için yapılan sistemli çalışmalardır. Kurumların sahip oldukları yazılımların bünyelerinde barındırdıkları çok sayıda ki veri içerisinde bulunan verilerin elde edilmesi işlemi de denilebilir. Elde edilen veriler eşliğinde yapılacak yatırımlar ve kar oranları belirlenir. Yatırım oranları ve kar artışı belirlenerek yatırım süreçleri hesaplanır.
İstatistik, veri tabanı teknolojileri, makine, yapay zekâ ve görsel bilgisi gibi disiplinlere ihtiyaç duyulan bir alandır. Bunların yanı sıra; matematik, lineer cebir, optimizasyon ve gelişmiş yazılım becerilerine ihtiyaç duyulan bir alandır. R ve Python veri madenciliği yapılabilmesi için en uygun sayılabilen yazılım dilleridir. Veri madenciliği yazılımın geçtiği hemen her alanda kullanılabilmektedir. Bankacılık, sigortacılık ve pazarlama alanlarında sıklıkla kullanılan bir yöntemdir.
Veri madenciliği ile;
• İnternette yapılan işlemleri anlamlandırmak kolaydır.
• Müşteri istatistikleri ile müşterilerin satın alma davranışları belirlenir.
• Müşterilerin sosyo-ekonomik ve demografik özellikleri belirlenir.
• Müşteri sadakati sağlanır.
• Satış tahminleri ve istatistikleri belirlenir.
• Tıp alanında hastalık tanısı konmasında ki veriler istatistik olarak hesaplanır ve tedavi yöntemleri belirlenir,
• Spor alanında futbol, voleybol ve basketbol rakip analizleri belirlenir.
Veri Madenciliği İşlemi
Verinin büyüklüğüne bağlı olarak izlenecek yol farklılık göstermektedir. Bunlar;
Veri temizleme:
Eksik veya fazla olan verilerin temizlenmesi işlemidir.
Veri bütünleştirme:
Veri kaynaklarını birleştirme işlemidir.
Veri seçme:
Sistemde oluşan sorunlardan kaynaklı olarak verilerin seçilmesi sürecidir.
Veri dönüşümü:
Kurumsal web, e-ticaret, mobil web sitelerinin bünyelerinde barındırdıkları verilerin kullanılabilecek hale dönüştürülmesini uygun hale getirme işlemidir.
Veri madenciliği:
İhtiyaç duyulan verilerin kullanılabilecek formlara dönüştürülüp kullanılması işlemine denir.
Örüntü değerlendirme:
Ölçümler yardımıyla elde edilen verileri gösteren örüntüler şeklinde tanımlanabilir.
Bilgi sunumu:
Veri madenciliği ile çeşitli yöntemler kullanılarak elde edilmiş verilerin kullanıcıya ulaştırılması işlemidir.
Farklı işlemlere ve disiplinlere ihtiyaç duyulan bu alanda son yıllarda yapay zekâ, makine öğrenimi gibi özellikler veri madenciliği işlemine yardımcı olmuştur. Veri madenciliği ile dijital sınıflandırma, yorumlama, satış artışı, müşteri ihtiyaçları gibi özellikler belirlenerek tam da ihtiyaç duyulan verilerin eldesi kolaylaşır.
Veri Madenciliği Nedir?
Gelecekle ilgili tahmin mi yapmak istiyorsunuz? Veri madenciliği tam da bu işe yaramaktadır. Bilgisayar programları kullanarak elde etmek kolaydır işte bu tekniklerden bazıları:
• Regresyon sınıflandırılması
• Nöral ağlar
• Birliktelik analizi
• Temel bileşen analizi
• K-en
• Doğrusal regresyon
• Lojistik regresyon
• Zaman serisi
• Kümeleme
Günümüz gelişen teknoloji çağında şirketler çok büyük veriler ile çalışmaktadır. Bu kitlesel veriler içinde yararlı ve ihtiyaçlara yönelik verilerin alınabilesi için veri madenciliği kullanılmaktadır. Bu işlemlerin bazıları tüketicileri rahatsız etmektedir. Verilerini korumak adına Avrupa’da Genel Veri Koruma Yönetmeliği (GDPR) yürürlüğe girmiştir.