Türkçe Şiir Verikümesi Üzerinde Denetimli Öğrenme ile Doğal Dil İşleme Tabanlı Şair Tanıma


Creative Commons License

Korkmaz S., Köylü F.

4th International Conference on Access to Recent Advances in Engineering and Digitalization (ARACONF 2024), Kayseri, Türkiye, 27 - 28 Mayıs 2024, cilt.4, sa.1, ss.115-122

  • Yayın Türü: Bildiri / Tam Metin Bildiri
  • Cilt numarası: 4
  • Doi Numarası: 10.56038/oprd.v4i1.470
  • Basıldığı Şehir: Kayseri
  • Basıldığı Ülke: Türkiye
  • Sayfa Sayıları: ss.115-122
  • Erciyes Üniversitesi Adresli: Evet

Özet

Doğal dil işleme temelli çalışmalar günümüzde oldukça popüler durumda olmakla birlikte Türkçe temelli güncel çalışmalarda da artış görülmektedir.Yazar tanıma problemi, isimsiz bir metnin popüler yazarlardan birine ait olup olmadığının tespit edilmesine dayanmaktadır. Her bir yazarın eserinin yazara ait entellektüel bilgi dağarcığı hakkında temel bazı özellikleri yansıtacağı ve böylece yazarları birbirinden ayırabilmenin mümkün olabileceği fikri üzerine bu araştırma problemi ortaya çıkmıştır. Bu çalışmada Türk Edebiyatından 5 farklı şairin 50 şiiri alınmış ve bir verikümesi elde edilmiştir. Verikümesi üzerinde 9 farklı sınıflandırıcı yöntem kullanılarak deneyler gerçekleştirilmiştir. İlerleyen çalışmalara temel teşkil edecek bir ön çalışma ortaya konulmuştur.

Natural language processing-based studies become popular nowadays and Turkish based studies are increasing. The problem of author classification is based on determining whether an anonymous text belongs to one of the popular authors. This research problem is motivated by the idea that each author's work will reflect some basic features about the author's intellectual vocabulary and thus it should be possible to distinguish between authors. In this study, 50 poems of 5 different poets from Turkish Literature were taken and a dataset was obtained. Experiments were performed on the dataset using 9 different classifier methods. This is a preliminary study that will serve as a basis for future studies.