OpenAI'nin yeni GPT-4 yapay zeka modeli büyük çıkışını yaptı ve görme engelliler için sanal bir gönüllüden Duolingo'da geliştirilmiş bir dil öğrenme botuna kadar her şeye güç vermeye başladı. Peki GPT-4'ü ChatGPT ve GPT-3.5 gibi önceki sürümlerden ayıran nedir? İşte bu popüler sistemler arasındaki en büyük beş fark.
İlk olarak, bu ismin içinde ne var? ChatGPT başlangıçta GPT-3.5 (ve dolayısıyla GPT-3'ün birkaç versiyon ötesi) olarak tanımlanmış olsa da, OpenAI'nin büyük dil modelinin bir versiyonu değil, daha ziyade hangi modele güç veriyorsa onun sohbet tabanlı bir arayüzüdür. Son birkaç ay içinde popülerlik kazanan ChatGPT sistemi GPT-3.5 ile etkileşim kurmanın bir yoluydu. Şimdi de GPT-4 ile etkileşim kurmanın bir yolu.
İlginizi çekebilir: OpenAI, Yeni Özelliklerle GPT-4’ü Piyasaya Sürüyor
1. GPT-4 görüntüleri görebilir ve anlayabilir
Bu çok yönlü makine öğrenme sistemindeki en dikkat çekici değişiklik "çok yönlü" olması, yani birden fazla bilgi " modunu" anlayabilmesi. ChatGPT ve GPT-3 metinle sınırlıydı: Okuyup yazabiliyorlardı ama hepsi bu kadardı (yine de birçok uygulama için fazlasıyla yeterliydi). Ancak GPT-4'e resimler verilebilir ve ilgili bilgileri bulmak için bunları işleyecektir. Elbette basitçe bir resimde ne olduğunu tarif etmesini isteyebilirsiniz, ancak daha da önemlisi anlayışı bunun ötesine geçiyor. OpenAI tarafından verilen örnekte aslında komik bir şekilde büyük boyutlu bir iPhone konektörünün görüntüsündeki espriyi açıklıyor. Ancak kör ve az gören insanlar tarafından kullanılan ve gönüllülerin telefonlarının ne gördüğünü açıklamasına izin veren bir uygulama olan Be My Eyes ile ortaklık daha açıklayıcı.
Be My Eyes için hazırlanan videoda GPT-4 bir elbisenin desenini tanımlıyor, bir bitkiyi tanımlıyor, spor salonunda belirli bir makineye nasıl ulaşılacağını açıklıyor, bir etiketi tercüme ediyor (ve bir yemek tarifi sunuyor), bir haritayı okuyor ve bir görüntüde ne olduğunu gerçekten anladığını gösteren bir dizi başka görevi yerine getiriyor - eğer doğru sorular sorulursa. Elbisenin neye benzediğini bilir ama iş görüşmeniz için doğru kıyafet olup olmadığını bilemeyebilir.
2. GPT-4'ü kandırmak daha zordur
Günümüzün sohbet robotları doğru yaptıkları her şeye rağmen, kolayca yoldan çıkma eğilimindedirler. Küçük bir ikna çabası onları sadece "kötü bir yapay zekanın" ne yapacağını açıkladıklarına ya da modelin her türlü tuhaf ve açıkçası sinir bozucu şeyi söylemesine izin veren başka bir küçük kurguya ikna edebilir. İnsanlar ChatGPT ve diğerlerini ellerinden hızla kaçıran "firar" komutları üzerinde bile işbirliği yapıyorlar.
OpenAI'nin tanımına göre, GPT-3.5 (ChatGPT'ye güç veren) yeni bir eğitim mimarisinin "test çalışmasıydı" ve bundan aldıkları dersleri "benzeri görülmemiş derecede istikrarlı" olan yeni sürüme uyguladılar. Ayrıca yeteneklerini daha iyi tahmin edebildiler, bu da daha az sürpriz olmasını sağladı.
3. GPT-4 daha güçlü bir hafızaya sahiptir
Bu büyük dil modelleri milyonlarca web sayfası, kitap ve diğer metin verileri üzerinde eğitilir. Ancak bir kullanıcıyla gerçekten bir konuşma yaptıklarında, "akıllarında" ne kadar tutabileceklerinin bir sınırı vardır (biri anlayışla karşılar). GPT-3.5 ve ChatGPT'nin eski sürümünde bu sınır 4,096 "token" idi, bu da yaklaşık 8,000 kelime veya kabaca bir kitabın dört ila beş sayfası anlamına geliyordu. Dolayısıyla, dikkat işlevinde bu kadar "geri" gittikten sonra bir nevi izini kaybediyordu. GPT-4'ün maksimum token sayısı 32.768'dir. Bu da yaklaşık 64.000 kelime ya da 50 sayfalık bir metin anlamına gelir ki bu da bütün bir oyun ya da kısa hikaye için yeterlidir.
Bunun anlamı, sohbet ederken veya metin oluştururken 50 sayfaya kadar aklında tutabileceğidir. Yani 20 sayfa önce ne hakkında konuştuğunuzu hatırlayacak ya da bir hikaye veya deneme yazarken 35 sayfa önce meydana gelen olaylara atıfta bulunabilecektir. Bu, dikkat mekanizmasının ve belirteç sayısının nasıl çalıştığına dair çok yaklaşık bir açıklama. Ancak genel fikir, genişletilmiş bellek ve buna eşlik eden yeteneklerdir.
4. GPT-4 birden çok dillidir
Yapay zeka dünyasına İngilizce konuşanlar hakimdir ve verilerden testlere ve araştırma makalelerine kadar her şey bu dildedir. Ancak elbette büyük dil modellerinin yetenekleri herhangi bir yazılı dilde uygulanabilir ve bu dillerde de kullanılabilir hale getirilmelidir. GPT-4, İtalyanca'dan Ukraynaca'ya ve Korece'ye kadar 26 dilde binlerce çoktan seçmeli soruyu yüksek doğrulukla yanıtlayabildiğini göstererek bu yönde bir adım atmıştır. Roman ve Cermen dillerinde en iyisidir, ancak diğer dillere de iyi bir şekilde genelleme yapar.
Dil yeteneklerinin bu ilk testi umut verici ancak çok dilli yeteneklerin tam olarak benimsenmesinden uzak; test kriterleri başlangıçta İngilizce'den çevrildi. Ayrıca çoktan seçmeli sorular sıradan konuşmayı gerçekten temsil etmiyor. Ancak özel olarak eğitilmediği bir konuda harika bir iş çıkardı. Bu da GPT-4'ün İngilizce konuşmayanlar için çok daha dostane olma olasılığını gösteriyor.
5. GPT-4'ün farklı "kişilikleri" vardır
"Yönlendirilebilirlik" yapay zekada ilginç bir kavramdır ve talep üzerine davranışlarını değiştirme kapasitelerine atıfta bulunur. Bu, sempatik bir dinleyici rolünü üstlenmek gibi faydalı olabileceği gibi, insanların modeli kötü ya da depresif olduğuna ikna etmesi gibi tehlikeli de olabilir. GPT-4, yönlendirilebilirliği GPT-3.5'ten daha doğal bir şekilde entegre ediyor ve kullanıcılar "sabit bir sözlük, ton ve stile sahip klasik ChatGPT kişiliğini" ihtiyaçlarına daha uygun bir şekilde değiştirebilecekler. "Sınırlar dahilinde" diyen ekip, bunun modelin karakterini bozmanın en kolay yolu olduğuna dikkat çekiyor.
Bu, sohbet robotunu "Masaüstü RPG'de bir DM olduğunuzu varsayın" veya "Kablolu haber için röportaj yapan bir kişiymişsiniz gibi cevap verin" gibi mesajlarla hazırlayarak bir şekilde yapılabilir. Ama aslında sadece "varsayılan" GPT-3.5 kişiliğine önerilerde bulunuyordunuz. Artık geliştiriciler ilk bakıştan itibaren bir bakış açısı, konuşma tarzı, ses tonu veya etkileşim yöntemi ekleyebilecekler.
GPT-4'ün karakterini bozmayı reddettiğine dair verdikleri örnekler oldukça eğlenceli:
GPT-4 ve öncekiler arasında, çoğu bunlardan daha ince veya teknik olan çok daha fazla fark var. Şüphesiz aylar geçtikçe ve kullanıcılar en yeni dil modelini test ettikçe daha pek çok şey öğreneceğiz. GPT-4'ü kendiniz test etmek ister misiniz? OpenAI'nin ücretli hizmeti ChatGPT Plus'a geliyor, yakında geliştiriciler için API aracılığıyla sunulacak ve muhtemelen yakında ücretsiz bir demoya sahip olacak.
Kaynak: techcrunch
Bu habere henüz yorum yazılmamış, haydi ilk yorumu siz bırakın!...