Makine Öğrenme Yöntemleri Kullanılarak Doğal Dil İşleme Tabanlı Şair Tanıma


Tezin Türü: Yüksek Lisans

Tezin Yürütüldüğü Kurum: Erciyes Üniversitesi, Fen Bilimleri Enstitüsü, --, Türkiye

Tezin Onay Tarihi: 2021

Tezin Dili: Türkçe

Öğrenci: SERKAN KORKMAZ

Danışman: Fehim Köylü

Özet:

    Doğal Dil İşleme (DDİ), insanlar tarafından günlük hayatta konuşulan doğal dil kullanılarak yazılan bir metnin bilgisayar sistemleri tarafından analiz edilmesini, çözümlenmesini, yorumlanarak anlaşılmasını ve doğal dilde çıktı üretilmesini esas alan bir mühendislik alanıdır.
    
    Yazar Tanıma, edebi metinlerde eserin yazarının tespit edilmesinde güçlük yaşandığı durumlarda edebi eserin yazarının belirlenmesi işlemidir.

    İnternetin hızla yaygınlaşması ve internet üzerinde paylaşılan veri miktarının artmasıyla birlikte eser intihali sorun haline gelmektedir. Teknolojik ilerlemeler ile birlikte, herhangi bir kişi, başka bir kişiye ait olan bir metni internet üzerinde kendi eseri gibi gösterebilmektedir. Edebi metinler üzerinde birden fazla kişinin hak iddia etmesi gibi durumlarda yazar tanıma yöntemleri büyük önem kazanmaktadır.

    Yazar tanıma yöntemlerinin genel özelliği, yazarların metinlerinde kullandıkları sık geçen kelimeler, kelime kökleri, kelime köklerine eklenen ekler, noktalama işaretleri, kelime türleri gibi yazara özgü olan özellikleri yani kişinin yazım tarzını tespit etmektir. Bu da doğal dil işleme yöntemlerini kullanmayı gerektirir.

    Eser intihalinin yapılması ile edebi bir eserin zarar görebilmesi ihtimali göz önüne alındığında, eser sahibini sıkıntıya sokacak hak ihlallerinin giderilmesi amacıyla edebi eserlerde geçen kelimelerin özelliklerinin morfolojik olarak incelenmesinin gerekliliği düşünülmüştür.

    Bu çalışmada 75 şaire ait 2805 şiir, morfolojik analizde yer alan kök bulma, ek bulma, kelime yapısının incelenmesi gibi yöntemler ile incelenmiştir. Böylelikle, edebi eserlerde kullanılan kelimelerin istatistiksel analizi yapılmıştır.