Veri madenciliği, büyük ölçekli veriler arasından faydalı bilgiye ulaşma, bilgiyi madenleme işidir. Büyük veri yığınları içerisinden gelecekle ilgili tahminde bulunabilmemizi sağlayabilecek bağıntıların bilgisayar programı kullanarak aranması olarak da tanımlanabilir.
Kısaca günümüzde Google’ın bizi dinlemesi, Facebook’un verilerimizi ve beğendiklerimizi kayıt altına alması, Gmail üzerindeki maillerimizin botlar tarafından okunması veri madenciliğinin ta kendisi. Örnek vermek gerekirse; Google arama motoru üzerinden köpeğinize oyuncak aradınız fakat daha sonrasında farklı sitelere girdiğinizde Google reklamları kısmında köpek oyuncakları çıkıyor. Bu veri madenciliği yapılması ve o verilerin analiz edilmesi sonucu olarak bizim karşımıza çıkıyor.
Veriler işlenmediği sürece değersizdir. Şu an birçok ücretsiz uygulama sizden ücret talep etmiyor olabilir ama sizin verilerinizi topluyorlar. Bir çok kullanıcı verilerinin toplanması konusunda tepkisiz. Çok bir önem teşkil ettiğini de düşünmüyor. Otobüste yanımızdaki telefonumuzun ekranını izleyince gerilen bizler, gizliliğimiz hiçe sayılarak hayatımızın içine dahil edilen veri madenciliğine tepki veremiyoruz.
Şahsi bilgilerimizin korunduğundan emin miyiz?
Günümüzde herkesin mutlaka bir sosyal medya hesabı var. Instagram, Facebook, Twitter hepimiz kullanıyoruz. Bu gibi sosyal medya siteleri ve niceleri sizin verilerinizi topluyor ve diğer sitelere satıyor. Mesela Facebook sizin hangi sayfalarını beğendiğinizi takip ediyor ve ona benzer sayfaları sizin önünüze getiriyor. Google, sunduğu her hizmette sizin bilgilerinizi topluyor. Son dönemde Facebook’un yaşadığı sıkıntılar ortada. Kullanıcıların verilerini toplayan Facebook, Cambridge Analytica ile paylaşmış daha sonra bu ortaya çıkınca ABD Kongresi’nde ifade vermek zorunda kalmıştı.
Veri madenciliği için en çok kullanılan araçlardan birisi de akıllı telefonlar. Örneğin firmalar veri madenciliği kullanılarak mobil kullanıcıların eğilimleri saptanmakta, bir market müşterisinin geçmiş kayıtlarından satın alma davranışı, beklentisi ve eğilimi izlenmekte, bir bölgenin deprem verileri analiziyle olası tehlikeler gözlenmekte, yeni/eski bir yazılımın hata oranları belirlenmekte, öğrencilerin başarı ve başarısızlık durumlarının sebepleri üzerine araştırmalar yapılmakta, kalite iyileştirme çalışmaları denenmekte ve daha birçok alanda çeşitli çalışmalara adım atılmaktadır.
Veri madenciliği, işletmelere tarafından yaygın olarak müşteri odaklı olarak kullanılıyor. Veri madenciliği ile pazar oluşturma/geliştirme çalışmaları yapılmakta ve müşteri memnuniyeti sağlanmaya çalışılmaktadır. Memnuniyet sağlarken gizliliğe ne kadar saygı gösterildiği ise büyük bir soru işareti.