Mekân-Zamansal Yüksek Ortalama-Faydalı Örüntülerin Madenciliği Için Tekniklerin Geliştirilmesi


ÇELİK M. (Yürütücü), Yıldırım İ.

TÜBİTAK Projesi, 1001 - Bilimsel ve Teknolojik Araştırma Projelerini Destekleme Programı, 2019 - 2022

  • Proje Türü: TÜBİTAK Projesi
  • Destek Programı: 1001 - Bilimsel ve Teknolojik Araştırma Projelerini Destekleme Programı
  • Başlama Tarihi: Kasım 2019
  • Bitiş Tarihi: Mayıs 2022

Proje Özeti

Klasik birliktelik analizi öğelerin ikili (boolean) olduğunu varsayar ve öğelerin ağırlığını/faydasını (bir ürünün bir müşteri tarafından birden fazla satın alınması, bir hastalık için sağlık parametrelerinin önem derecelerinin olması, işlenen suçların önem derecelerinin veya sayısının olması gibi) göz önüne almaz. Bu eksikliğin giderilmesi için örüntüyü oluşturan öğelerin faydalarını gözönüne alan yüksek faydalı örüntü (YFÖ) madenciliği çalışmaları yapılmıştır. Ancak YFÖ madenciliği çalışmalarında eğer bir öğe yüksek faydalı ise (bir ürünün kar oranının yüksek olması gibi), bu öğe ile birliktelik oluşturan faydalı ve/veya faydasız (zarar ettiren ürünler gibi) bütün öğeler yüksek faydalı örüntülere dahil olabilmektedir. Bu durumda bazı örüntülerin fayda değeri düşmekte ve bazı örüntüler ise yaygınlığını kaybedebilmektedir. Bu eksikliği gidermek için, literatürde, içerdiği öğelerin ortalama faydalarının belirli bir fayda değerinin altında olmadığı örüntülerin analizini yapan yüksek ortalama-faydalı örüntü (YOFÖ) madenciliği çalışmaları yapılmıştır.

Geleneksel YOFÖ madenciliği yöntemleri verilerin mekânsal, zamansal ve mekan-zamansal (MZ) özelliklerini göz ardı ederler veya verilerin aynı mekânsal ve/veya zamansal özelliklere sahip olduklarını varsayarlar. Ancak bu varsayım Tobler’in “Coğrafya’nın İlk Kuralı”nı ihlal eder. Tobler’e göre “herşey herşeyle ilişkilidir, fakat uzayda birbirlerine yakın olan öğeler (nesneler) uzak olanlara göre daha çok ilişkilidirler“. Bu prensip zaman içerisinde birbirlerinden yakın ve uzak olan öğeler için de geçerlidir. Diğer bir ifadeyle birbirlerine mekânsal ve zamansal olarak yakın öğeler birbirlerini etkilemeye meyillidir. Bu nedenle geleneksel bilgi keşfi teknikleri MZ verilerin analizinde yetersiz kalırlar. Bu projenin amacı mekânsal, zamansal ve MZ yüksek ortalama faydalı örüntülerin madenciliği için yeni ve özgün veri yapıları ve algoritmalar geliştirmektir.

 

Literatürdeki YOFÖ madenciliği yöntemlerinin başlıca dört temel eksikliği bulunmaktadır; 1) verilerin mekânsal, zamansal ve MZ özelliklerini modellemede yetersiz kalmaktadır ve dolayısı ile yeni ve özgün örüntüleri tanımlayamamaktadır, 2) mekânsal, zamansal ve MZ verilerin ve örüntülerin indekslenmesi için etkili ve ölçeklenebilir veri yapları önerememektedir, 3) mekânsal, zamansal ve MZ verilerin analizinde ve örüntülerin keşfinde yetersiz kalmaktadır ve 4) mevcut yöntemlerin kullandıkları değerlendirme ölçütleri mekânsal, zamansal ve MZ verilerin analizinde yetersiz kalmaktadır.

Bu proje bu eksikliklerin üstesinden gelebilmek için; 1) MZ verilerin yapısına uygun yeni bir taksonomi oluşturmayı ve yeni örüntüleri tanımlamayı, 2) MZ verilerin ve örüntülerin yapısına uygun veri yapıları  geliştirmeyi, 3) MZ verilerin analiz için hızlı ve etkin örüntü madenciliği algoritmalarını geliştirmeyi ve iv) anlamlı ve ilginç örüntüleri niteleyen ve keşfini kolaylaştıran yeni ve özgün değerlendirme ölçütleri tanımlamayı hedeflemektedir.

Önerilen bu araştırma sonuçları mekânsal, zamansal ve MZ verilerin analizi için yeni analiz teknikleri sağlayacaktır. Çalışma tamamlandığında; 1) mekansal, zamansal ve MZ örüntüler tanımlanacaktır, 2) YOFÖ madenciliği için yeni ve özgün değerlendirme ölçütleri tanımlanacaktır, 3) verilerin indekslenmesi ve veri keşfi karmaşıklığının azaltılması için yeni veri yapıları geliştirilecektir, 4) geliştirilen değerlendirme ölçütleri ve veri yapıları kullanılarak yeni ve özgün algoritmalar geliştirilecektir, 5) geliştirilen yöntemlerin performansları gerçek ve sentetik veriler kullanılarak değerlendirilecektir ve 6) çalışma sonuçları ulusal ve uluslararası platformlarda sunulacak ve yayınlanacaktır.