Bu projede, spam e-posta mesajlarının önlenmesine yönelik olarak Türkçe için spam-önler filtreleme metotları geliştirilecektir. Günümüzde spam mesajlar tüm e-posta mesajlarının %10’unu oluşturmaktadır ve kullanıcılar açısından önemli zaman kayıplarına neden olmaktadır. İngilizce gibi yaygın diller için filtreleme algoritmaları mevcuttur, fakat Türkçe mesajlar için henüz böyle bir çalışma yapılmamıştır. Bu tür bir çalışmada Türkçe’nin karmaşık morfolojik yapısının gözönüne alınması gerekmektedir. Bu projede geliştirilecek olan metotlar dinamik olacaktır ve yapay sinir ağları ile Bayesian ağları tekniklerine dayanacaktır. Ortaya konulacak olan algoritmaların iki temel bileşeni içereceği düşünülmektedir: Mesaj içeriklerinin morfolojik analizini yapacak bir morfoloji modülü ve mesajları normal ve spam olarak sınıflandıracak bir öğrenme modülü.
Developing Dynamic and Adaptive Methods for Turkish Spam Filtering
BAP
Tunga Güngör
2003 to 2004
04A101