Makine Çevirisi
Hazırlayan: Yağmur Eryalçın, Düzelten: Buket Buse Sırrı, Son Okuyan: Buse Daştan
Hazırlayan: Yağmur Eryalçın, Düzelten: Buket Buse Sırrı, Son Okuyan: Buse Daştan
Makine çevirisi (MÇ), bilgisayar programları kullanılarak bir dilin (kaynak dil) başka bir dile (erek dil) otomatik olarak çevrilmesidir. Çok dilli iletişim, küreselleşme ve bilginin yayılmasında önemli rol oynayan makine çevirisinin kökenleri 20. yüzyılın ortalarına kadar uzanmaktadır. O günden bu yana çeviri kalitesini artırmaya yönelik birçok çalışma yapılmış olsa da tam anlamıyla insan çevirisiyle eşdeğer bir sistem henüz geliştirilmemiştir. Buna rağmen, MÇ sistemleri birçok sektörde etkili bir şekilde kullanılmaktadır.
MAKİNE ÇEVİRİSİNİN TARİHİ
İkinci Dünya Savaşı’ndan sonra makine çevirisi alanında önemli gelişmeler yaşanmıştır. Soğuk Savaş döneminde, ABD askerî amaçlarla otomatik çeviri projelerine büyük yatırımlar yaparken, diğer ülkeler de daha küçük çaplı çalışmalar yürütmüştür. İlk MÇ sistemleri kelimeleri erek dile birebir çeviriyordu; ancak bu sistemler dilin karmaşık yapısını göz ardı ettiği için başarılı olamadılar. 1959’da Yehoshua Bar-Hillel’in ve 1966’da ALPAC (Otomatik Dil İşleme Danışma Kurulu) komitesinin yayınladığı raporlar, MÇ’nin yetersizliklerini eleştirerek araştırmaların gidişatını değiştirdi. Bunun yerine dilbilimciler, bilgisayarların dili nasıl işleyebileceği üzerine araştırmalar yürüterek bilgisayarlı dilbilim alanına odaklanmaya başladılar.
MAKİNE ÇEVİRİSİ TÜRLERİ
Kural Tabanlı Makine Çevirisi Sistemleri
Kural tabanlı makine çevirisi sistemleri, kaynak metni analiz edip erek dilde eşdeğer bir çıktı oluşturmak için dilbilgisel kuralları kullanır. Başka bir deyişle, bilgisayara dilbilgisi kuralları öğretilir. Kurallar elle yazıldığı için bu işlem zaman alır ve sisteme yeni dillerin eklenmesi zordur. Ayrıca, dillerin karmaşık yapısından dolayı bu yöntemin bazı hatalara neden olması kaçınılmazdır. Yine de bu sistemler belirli alanlardaki teknik çevirilerde tutarlı sonuçlar verebilir. Bu sistemler kullandıkları yönteme göre üçe ayrılırlar:
1. Doğrudan Makine Çevirisi: Bu sistem sözcüğü sözcüğüne çeviri yapar ve basit sözdizimsel düzenlemeler uygular.
2. Aktarım Makine Çevirisi: Bu yaklaşımda sistem, kaynak dildeki metnin dilbilgisi kurallarını analiz eder. Ardından kaynak dilin cümle yapısını, erek dile uygun bir biçimde dönüştürür. Son olarak erek dilin kurallarına uygun biçimde çeviri yapar.
3. Aradil Makine Çevirisi: Aradil, kaynak dili erek dile çevirirken kullanılan yapay ya da doğal bir dildir. Kaynak dildeki cümle önce aradil adı verilen ortak bir dile çevrilir. Daha sonra, erek dile çeviri yapılır.
Derlem Tabanlı Makine Çevirisi Sistemleri
1990’larda popülerlik kazanan bu yöntem, büyük çeviri metinlerinden oluşan yığınlardan (derlemlerden) yararlanır.
Bu çeviri sistemlerinin iki ana türü vardır:
1. İstatistiksel Makine Çevirisi
İstatistiksel makine çevirisi sistemi, çeviri yapmak için dilbilgisi kurallarını değil, büyük çift dilli metin derlemlerini analiz eder. Bu metinler üzerinden istatistiksel analiz yapar ve en muhtemel çeviriyi tahmin eder. Örneğin, İngilizce bir cümleyi Türkçeye çevirirken, erek dilde en doğru karşılığı belirlemeye çalışır. Bu sistemin dezavantajı ise yalnızca istatistiklere dayandığı için hangi anlamın doğru olduğunu her zaman anlayamamasıdır.
2. Örnek Tabanlı Makine Çevirisi
Örnek tabanlı makine çevirisi, daha önce çevrilmiş metinlerden faydalanılarak yapılan bir çeviri türüdür. Bu sistem yeni çeviri taleplerini, veri tabanındaki benzer çeviri örnekleriyle karşılaştırarak en uygun çeviri parçalarını seçer ve birleştirir. İstatistiksel makine çevirisinden farklı olarak bu yaklaşımda daha önce çevrilmiş örneklerle benzetme yaparak çeviri gerçekleştirilir. Örneklere dayalı çeviri yöntemi kullandığı için bu yaklaşımın daha doğal ve akıcı çeviriler ürettiği iddia edilmektedir.
Nöral Makine Çevirisi
Nöral makine çevirisi, en gelişmiş makine çevirisi türüdür. Bu sistemi eğitmek için yapay sinir ağları kullanılır. Sistem, insanlar tarafından yapılan büyük çaplı çeviri örnekleriyle eğitilir. Yani, metinleri analiz ederek hangi kelimelerin nasıl çevrildiğini öğrenir ve yeni metinleri bu bilgilere dayanarak çevirir. Nöral makine çevirisi sistemleri, makine çevirisindeki gelişmelere rağmen tamamen kusursuz çalışmaz ve hâlâ insan müdahalesine ihtiyaç duyabilir. Yine de, önceki makine çeviri sistemleriyle karşılaştırıldığında çok daha başarılı sonuçlar vermektedir.
Günümüzde en yaygın biçimde kullanılan makine çevirisi sistemleri üç ana kategoriye ayrılmaktadır:
1. ÖZEL AMAÇLI SİSTEMLER
Genel amaçlı makine çevirisi sistemleri, herhangi bir konu alanındaki metinleri çevirebilen sistemlerdir. Genel dil kullanımı için tasarlandığından her türden metni doğru şekilde çeviremeyebilirler. Bunun önüne geçmek için bazı çeviri sistemleri belirli bir alana odaklanarak geliştirilir. Bu tür sistemlere özel amaçlı çeviri sistemleri denir. Bu sistemler, hukuki belgeler, kullanım kılavuzları gibi belirli bir sektöre veya konuya özel olarak geliştirilen sistemlerdir. Bu sayede, çeviri kalitesini arttırmaya yardımcı olurlar. Hatta, bazı durumlarda, ortaya çıkan çeviri çıktıları insan müdahalesine ihtiyaç duyulmayacak kadar kaliteli olabilir.
2. KONUŞMA ÇEVİRİSİ SİSTEMLERİ
Bilgisayar destekli çevirinin en yenilikçi alanı olan bu sistem sayesinde makine çevirisinin yalnızca yazılı metinlerle sınırlı kalmadığı, konuşma çevirisinde de geliştiği görülmektedir.1980’lerde konuşma teknolojilerindeki ilerlemeler, konuşma çevirisini makine aracılığıyla yapılabilir hale getirmiştir. Bu alan, konuşma tanıma, konuşma üretme ve makine çevirisi teknolojilerinin birleşiminden oluşur.
3. ÇEVRİMİÇİ MAKİNE ÇEVİRİSİ SİSTEMLERİ
İnternetin yaygınlaşmasıyla birlikte, çevrimiçi makine çevirisi hizmetleri büyük bir ivme kazanmıştır. Bu hizmetlerin yaygınlaşması, makine çevirisi teknolojisinin gelişmesine büyük katkı sağlamıştır. Kullanıcıların bu sistemleri sürekli test etmesi ve geri bildirim vermesi, zamanla çeviri kalitesinin daha da iyileşmesine yardımcı olmaktadır.
MAKİNE ÇEVİRİSİNDE KARŞILAŞILAN ZORLUKLAR
Makine çevirisinin neden her zaman doğru çeviriler yapamadığını anlamak için, öncelikle çeviri yapmanın aslında ne kadar karmaşık bir süreç olduğunu göz önünde bulundurmak gerekir. Bir insanın bir metni bir dilden diğerine çevirebilmesi için hem dilsel hem de dil dışı bilgiye sahip olması gerekir. Makine çevirisi araçlarının da bunlara ihtiyacı vardır. Bilgisayarlar kelimelerin taşıdığı farklı anlamları ve bağlamları her zaman doğru şekilde anlayamadığından makine çevirisinde sık sık hatalar meydana gelir.
Makine çevirisinde belirsizliklerin giderilmesi önemli bir sorundur ve iki temel türü vardır: sözcüksel ve yapısal belirsizlikler. Sözcüksel belirsizlik, bir sözcüğün birden fazla anlama sahip olmasından dolayı ortaya çıkar. Yapısal belirsizlik ise bir cümlenin farklı dilbilgisel yapılarla yorumlanabilmesi durumudur. Yani, aynı sözcük dizilimi farklı anlamlar taşıyabilecek şekilde analiz edilebilir. Bu tür belirsizliklerin çözülebilmesi için makine çeviri sistemlerinin dünya bilgisine dayalı analizler yapabilmesi gerekir.
Farklı dillerin kelimeleri ve cümle yapıları çoğu zaman birebir eşleşmez. Bu durum çeviri yaparken bazı zorluklara yol açabilir ve çevirinin doğru olması için bağlamsal bilgilerin dikkate alınmasını gerektirebilir.
Sonuç olarak, makine çevirisi, ilk ortaya çıktığı günden bu yana büyük bir dönüşüm geçirmiş ve yapay zekâ destekli sistemler sayesinde önemli ölçüde ilerleme kaydetmiştir. Günümüzde MÇ, çok dilli iletişim için uygun maliyetli ve verimli bir araç olarak kullanılsa da kültürel ve bağlamsal doğruluk sağlamak için insan müdahalesi hâlâ gereklidir. Bu nedenle, bu alandaki öğrencilerin makine çevirisinin hem avantajlarını hem de sınırlamalarını anlamaları ve profesyonel kariyerlerinde ilerleyebilmek için makine çevirisini etkili bir şekilde kullanmayı öğrenmeleri büyük önem taşımaktadır.