Boğaziçi Üniversitesi Bilgisayar Mühendisliği Bölümü'ndeki Text Analytics and BIoInformatics Lab (TABILAB) Language Modeling Group proje ekibi TURNA adını verdiği Türkçe dil modelinin ilk aşamasını tamamlayıp Huggingface'te paylaşıma açtı (https://huggingface.co/spaces/boun-tabi-LMG/TURNA)
TURNA hakkında:
- Şimdiye kadar paylaşılmış en büyük encoder-decoder tabanlı modeldir (1.1 milyar parametreli)
- Üç tane üretken, beş tane de anlama dayalı görev ile yapılan deneylerde şimdiye kadar paylaşılan çoklu-dil destekli açık kaynaklı dil modellerinden daha iyi sonuç veriyor
- Türkçe görevleri çözmekte sıklıkla kullanılan BERTurk ile karşılaştırınca anlama dayalı görevlerin bazılarında daha iyi, bazılarında çok benzer sonuçlar alıyor
- Kendi görevlerinizi eğitebileceğiniz açık kaynaklı üretken bir dil modelidir
Daha çok bilgi edinmek için Arxiv’daki makaleye bakabilirsiniz.
Proje ekibi: Gökçe Uludoğan, Zeynep Yirmibeşoğlu Balal, Furkan Akkurt, Melikşah Türker, Onur Güngör, Susan Uskudarli
TURNA ile ilgili çalışmalar destek buldukça devam edecektir.