Microsoft Nvidia'nın Mart 2022 GPU Teknoloji Konferansı ile aynı zamanda şirketin dil çevirisini geliştiren çalışmalarında büyük ölçüde yol kat ettiğini iddia etti. Çağrı merkezleri, sohbet robotları ve üçüncü taraf uygulamalar arasında yaklaşık 100 dili çevirebilen Azure hizmeti için bir güncelleme duyurdu. Belirli diller arasında doğrudan çeviri yapabilen AI modelleri tarafından desteklenen Microsoft, güncel çalışmalarının önceki çeviri modellerine kıyasla %15'e kadar daha iyi olduğunu söylüyor. Yeni modeller ayrıca, farklı dillerde yazılmış metinleri içeren belgeleri çevirebilen çok dilli belge çevirisine sahip.
İlginizi Çekebilir: You.com AI Destekli Yazma Aracı YouWrite’ı Geliştirdi
Uzmanlar Z-kodunu Açıklıyor
Microsoft çeviri modellerini güçlendirmek konuşabilen, görebilen, duyabilen ve anlayabilen yazılımlar oluşturmak üzere AI modellerini baz alıyor. Bu güçlendirmede teknik olarak metin, görüntü, ses ve dili birleştirmek için daha büyük XYZ kodu girişiminin bir parçası olan Z kodunu kullanıyor. Ekip, çeşitli Microsoft ürünlerini geliştiren çok dilli, büyük ölçekli modeller oluşturmaya odaklanan Azure AI ve Project Turing araştırma grubundan bir grup bilim insanı ve mühendisten oluşuyor. Z-code, dil aileleri arasında yapay zeka destekli çeviri için çerçeve, mimari ve modeller sağlar. Microsoft, Z-code ile İngilizce gibi yaygın dillerin ötesine geçmeyi hedefliyor. Bunun için dünyadaki tahmini 1.500 "düşük kaynaklı" dil için çeviriyi geliştirmek üzere transfer öğrenimini kullandığını söylüyor. Tüm modeller gibi, Microsoft'lar da öğrenimlerini genel ve özel arşivlerin bir karışımından elde edilen büyük veri kümelerindeki örneklerden karşılıyor.
Düşük kaynaklı diller genellikle 1 milyondan az örnek cümleye sahip olarak tanımlanır ve bu da model geliştirmenin zorluğunu artırır. AI modelleri genellikle daha fazla örnek verildiğinde daha iyi performans gösterir. Birçoğu dil öğelerini paylaştığı için Microsoft, farklı diller arasında çok dilli olarak Z kodu modelleri geliştirir. Bu sayede bilgi, diller arasında aktarılır. Örneğin, bir modelin çeviri becerileri, doğal dili anlama yeteneğini geliştirmek için kullanılabilir. Microsoft, Gürcüce, Tibetçe ve Uygurca dahil olmak üzere 12 yeni dil için destek ekleyerek çeviriye geçen Ekim ayında Z koduyla çalışan geliştirmeler sundu. Şimdi şirket, Z kodunun geliştirilmiş bir sürümünün "düşük kaynaklı" dil nüanslarını daha iyi anlayabileceğini söylüyor.
İlginizi Çekebilir: DeepMind, Yapay Zekayla Antik Atina Kararnamelerini Çözümlüyor
Yapay Zeka Çeviri Uygulamalarını Güçlendiriyor
Microsoft, Z-code MoE'nin dil çevirisini iyileştirmede büyük adımlar attığını söylese de, sorun çözülmedi. Uzun bir atışla değil. Herkese açık örnek metinlerdeki önyargılar nedeniyle, İngilizce olmayan modeller İngilizce dilindeki emsallerinden daha kötü performans göstermeye devam etti. Örneğin, Wikipedia tabanlı veri kümelerindeki diller yalnızca boyuta göre değil, içeriği olmayan taslakların yüzdesine, düzenleme sayısına ve toplam kullanıcı sayısına göre de değişir. Wikipedia'nın ötesinde, Arapça ve Urduca gibi bazı dillerdeki e-kitaplar, metin yerine taranmış görüntüler olarak daha yaygın olarak bulunur; bu da, %70'e kadar düşük bir doğruluk oranına kadar inebilen optik karakter tanıma araçlarıyla işlenmesini gerektirir. The Conversation, farklı cinsiyet yanlılığı biçimleri de dahil olmak üzere, yapay zeka destekli çevirideki diğer kusurlara işaret ediyor. Bazı dillerde, Google Translate bir zamanlar doktorların erkek, hemşirelerin ise kadın olduğunu varsayarken, Bing'in tercümanı "masa yumuşaktır" gibi ifadeleri Almanca'da dişil "die Tabelle" olarak tercüme etti.
Tilburg Üniversitesi ve Maryland Üniversitesi'nden yapılan bir çalışma, normalleştirme olgusuna "çeviri" olarak atıfta bulundu. Ortak yazarlar, yapay zeka sistemlerinin çevirilerinde ölçülebilir bir "dilsel zenginlik" kaybı buldular. Microsoft, hem mimari iyileştirmeler hem de örnek verilerdeki yanlılığı azaltan teknikler yoluyla çeviriyi iyileştirmek için yeni yöntemler geliştirmeye devam ettiğini söylüyor.
Bu habere henüz yorum yazılmamış, haydi ilk yorumu siz bırakın!...