Natural Language Processing Based Poet Recognition with Supervised Learning on Turkish Poetry Dataset


Creative Commons License

Korkmaz S., Köylü F.

4th International Conference on Access to Recent Advances in Engineering and Digitalization (ARACONF 2024), Kayseri, Turkey, 27 - 28 May 2024, vol.4, no.1, pp.115-122

  • Publication Type: Conference Paper / Full Text
  • Volume: 4
  • Doi Number: 10.56038/oprd.v4i1.470
  • City: Kayseri
  • Country: Turkey
  • Page Numbers: pp.115-122
  • Erciyes University Affiliated: Yes

Abstract

Natural language processing-based studies become popular nowadays and Turkish based studies are increasing. The problem of author classification is based on determining whether an anonymous text belongs to one of the popular authors. This research problem is motivated by the idea that each author's work will reflect some basic features about the author's intellectual vocabulary and thus it should be possible to distinguish between authors. In this study, 50 poems of 5 different poets from Turkish Literature were taken and a dataset was obtained. Experiments were performed on the dataset using 9 different classifier methods. This is a preliminary study that will serve as a basis for future studies.

Doğal dil işleme temelli çalışmalar günümüzde oldukça popüler durumda olmakla birlikte Türkçe temelli güncel çalışmalarda da artış görülmektedir.Yazar tanıma problemi, isimsiz bir metnin popüler yazarlardan birine ait olup olmadığının tespit edilmesine dayanmaktadır. Her bir yazarın eserinin yazara ait entellektüel bilgi dağarcığı hakkında temel bazı özellikleri yansıtacağı ve böylece yazarları birbirinden ayırabilmenin mümkün olabileceği fikri üzerine bu araştırma problemi ortaya çıkmıştır. Bu çalışmada Türk Edebiyatından 5 farklı şairin 50 şiiri alınmış ve bir verikümesi elde edilmiştir. Verikümesi üzerinde 9 farklı sınıflandırıcı yöntem kullanılarak deneyler gerçekleştirilmiştir. İlerleyen çalışmalara temel teşkil edecek bir ön çalışma ortaya konulmuştur.