Development Of A Translation Memory System For Turkish To English

Development Of A Translation Memory System For Turkish To English

Advisor: 

Tunga Gungor

Assigned to: 

Pinar Kavak

Type: 

Year: 

2009

Status: 

Summary:

This thesis studies translation memory systems and development of a translation memory system from Turkish to English. A translation memory system is a tool that is designed for helping human translators during translation. It uses a database that consists of text parts such as blocks, paragraphs, sentences, or phrases in one language that is called source language and their translations in another language called target language. The translation memory system searches its database to and the closest sentence for the source sentence that has to be translated. Translation memory systems that are used by human translators offer the best matches for the review of the translator. The translator either accepts it, or edits it, or rejects it and asks for the second best result. Translation memory system concept is not popular for Turkish. To the best of our knowledge, there is no translation memory system developed for Turkish to English. This is the first translation memory system from Turkish to English, noting the existence of a previous example based machine translation system for Turkish to English, a similar but different concept. The proposed system uses a sentence level memory but exploits words and various linguistic features of the language. The similarity search algorithm takes advantage of highly agglutinative word structures, inectional and derivational affixes of Turkish. The presented framework considers orthographic, morphologic, lexical, semantic and syntactical features. It gains good success rate on Turkish (about 0.40 BLEU score) and is expected to be helpful on the translation of languages that have similar linguistic structure such as Hungarian or Finnish.

Özet:

Bu tez çeviri hafızası sistemleri ve Türkçe'den İngilizce'ye bir çeviri hafızası sistemi oluşturulması üzerine çalışmaktadır. Bir çeviri hafızası sistemi çevirmenlere çeviri esnasında yardımcı olması için tasarlanmış bir araçtır. Çeviri hafızası sistemi bir veritabanı kullanır ve bu veritabanı kaynak dilde bloklar, paragragraflar, cümleler veya deyimlerden ve bunların hedef dildeki çevirilerinden oluşur. Çeviri hafızası sistemi çevrilecek kaynak cümleye en yakın cümleyi bulmak için veritabanını araştırır. Çevirmen tarafından kullanılacak en iyi seçenekleri çevirmenin gözden geçirmesi için sunar. Çevirmen cevabı ya kabul eder, ya reddeder, ya üzerinde bazı düzenlemeler yapar, ya da bir sonraki en iyi sonucu ister. Çeviri hafızası sistemleri Türkçe için pek popüler bir kavram değildir. Bizim bilgilerimize göre daha önce Türkçe'den İngilizce'ye çeviri için oluşturulmuş bir çeviri hafızası sistemi yoktur. Bu sistem Türkçe İngilizce çeviri üzerine oluşturulan ilk çeviri hafızası sistemidir. Daha önce yapılmış bir örneğe dayalı makine çevirisi sistemi vardır, bu benzer ama farklı bir sistemdir. Önerilen sistem cümle bazlı bir veritabanı kullanır ama kelimelerden ve dilin bir çok dilbilimsel özelliğinden yararlanır. Benzerlik arama algoritması çok eklemeli kelime yapılarından, Türkçe'nin çekim ve yapım eklerinden yararlanır. Sunulan sistem dilin yazımsal, kökensel, dilsel, anlamsal ve sözdizimsel özelliklerini göz önünde bulundurur. Sistem Türkçe üzerinde iyi başarı oranı elde ediyor (yaklaşık 0.40 BLEU puanı) ve dilsel yapısı Türkçe'ye benzeyen Macarca ve Fince gibi dillerin çevirilerinde de yardımcı olacağı düşünülüyor.

Contact us

Department of Computer Engineering, Boğaziçi University,
34342 Bebek, Istanbul, Turkey

  • Phone: +90 212 359 45 23/24
  • Fax: +90 212 2872461
 

Connect with us

We're on Social Networks. Follow us & get in touch.