Doğal Dil İşleme Tekniklerini Kullanarak Türkçe Metinlerden Bilgi Çıkarımı


Tezin Türü: Yüksek Lisans

Tezin Yürütüldüğü Kurum: Erciyes Üniversitesi, Fen Bilimleri Enstitüsü, BİLGİSAYAR MÜHENDİSLİĞİ ANABİLİM DALI, Türkiye

Tezin Onay Tarihi: 2025

Tezin Dili: Türkçe

Öğrenci: FURKAN BAĞIRGAN

Danışman: Beyza Görkemli Bayram

Açık Arşiv Koleksiyonu: AVESİS Açık Erişim Koleksiyonu

Özet:

Metinler, insanların bilgiyi aktarmak için kullandığı araçların başında gelmektedir. Bilgiye erişim açısından metinlerden bilgi çıkarımı bu hususta büyük önem taşımaktadır. Metin verilerinin tek tek insanlar tarafından kontrol edilerek gerekli bilgilerin çıkarılması epey bir vakit ve maliyete yol açar. Bu sorunları ortadan kaldırmak için doğal dil işleme teknikleri kullanılır. Doğal dil işlemede yaygın olarak kullanılan anahtar sözcük çıkarımı, bir metnin en önemli ve temsil edici kelimelerini belirleyerek içeriği özetlemeye yardımcı olan temel yöntemlerden biridir. Anahtar sözcük çıkarımı anlamsal bağlam temelli ve sıklık frekansı temelli olmak üzere iki yolla mümkündür. Anlamsal bağlam, cümledeki kelimelerin anlamlarına dayalı bir çıkarım yapmaya olanak tanır. Sıklık frekansı ise kelimelerin metinde tekrarlanma sıklığı üzerinden elde edilir. Sıklık frekanslarının hesaplanması için öncelikle Türkçedeki kelimelerin yapısı bilinmelidir. Hiçbir eke sahip olmayan kökler ve bu köklerin yapım ekleri alarak yeni bir anlam kazanmasıyla oluşan gövdeler, tek başlarına bir anlama sahipken çekim ekleri alan kelimeler yeni bir anlam kazanmaz. Bu çalışmada, önceki çalışmaları temel alan yeni bir gövdeleme yöntemi geliştirilerek, Türkçedeki kısa öyküler üzerinde sıklık frekansları ile anahtar sözcük çıkarımı yapılmıştır. Çalışmanın sonuçları, sözlük kullanan kural tabanlı yeni bir gövdeleme yöntemi ile anahtar sözcük çıkarımının, anlatı türündeki metinler için sade ve etkili bir yaklaşım olup uygulanabilirliğini göstermiştir.