Yöneylem Araştırması ve Endüstri Mühendisliği 34. Ulusal Kongresi, YAEM 2014, Bursa, Türkiye, 25 - 27 Haziran 2014, ss.28
Firmalar müşterilerinin beklentilerinin üstünde hizmet verebilmek için onların memnuniyet süreçlerini yönetmek zorundadırlar. Müşterilerden geribildirimleri toplamaktan çok, toplanan bu verilerin yönetilmesi önem taşımaktadır. Müşteri geribildirimlerinin alınması, incelenmesi, ölçülerek analiz edilmesi ve değerlendirilmesi bir gereklilik haline gelmiştir. Etkili bir şikayet yönetim sistemi için, toplanan verilerin doğru şekilde, veri ve bilgi kaybı olmadan analiz edilmesi gerekmektedir. Yöneticiler yapısal olmayan büyük veri yığını içeresinde kaybolmadan bu veriyi anlamalıdır. Veri içinde gizli kalmış örüntüleri farkeden firmalar, sektörde rekabet üstünlüğü kazanırlar.
Metin madenciliğini (TM) kullanmadan, metin formatındaki büyük veriyi yöneticilerin otomatik olarak, ayrı ayrı okumaları ve bir bütün olarak analiz edebilmeleri mümkün değildir. Okumadan anlamaları ve önemli bilgileri gözden kaçırmamaları için TM tekniklerini kullanarak yapısal olmayan veriye sayılsal bir kimlik kazandırmaları gerekmektedir. TM uygulanarak hazırlık aşaması tamamlanan veri, uygun veri veya TM veya herhangi bir istatistiksel modelleme sürecine alınabilir.
Bu araştırmadaki amaç, Türkiye’deki üç büyük telekomünikasyon firmasının müşterilerinin neden aboneliklerini iptal ettiklerini özetlemek ve yapısal olmayan dökümanlardan bilgi çıkarımı yapmaktır. Dolayısıyla birçok metin ve veri madenciliği tekniği kullanılmıştır. 1.Nisan.2013-31.Mart.2014 tarihleri arasındaki bir yıllık zaman diliminde toplanmış, üç firmaya ait abonelik iptalleri ile ilgili, sırayla, 454, 573 ve 941 adetlerdeki müşteri şikayetlerinin yazılı olduğu serbet metin formatındaki dökümanların analizi yapılmıştır. Her firma için dökümanlar, TF-IDF (Terim Frekans-Ters Belge Frekans) yöntemi kullanılarak vektör formatına çevrilmiştir. Her döküman için tokenization algoritması, küçük harfe dönüştürme, dur-kelimelerini filtreleme, kelimelerin köklerini tespit etme işlemleri otomatik olarak yaptırılmıştır. TM önişleme teknikleri sonucunda kelime vektörü elde edilmiştir. Firmalar arasındaki benzerlikler Cosine benzerlik analizi ile yapılmıştır. Dökümanlar sınıflandırılmıştır. Böylece, örneğin, benzer döküman gruplarına otomatik olarak firmalar tarafından e-posta gönderilebilir. Bu araştırma sonucunda, tüketiciler ve firmalar hakkında daha önceden keşfedilmemiş bilgiler elde edilmiştir.
Anahtar Kelimeler: Veri madenciliği, Metin madenciliği, Telekominikasyon firmaları, Müşteri şikayetleri yönetimi