OpenAI, yeni nesil AI model ailesi o3'ü tanıttı ve bu modellerin şirketin güvenlik politikalarına uyum konusunda önemli adımlar attığını duyurdu.
OpenAI, Cuma günü yaptığı bir açıklamada, o3 olarak adlandırılan yeni bir yapay zeka model ailesini duyurdu. Şirket, bu modellerin, önceki modeller olan o1'e göre daha gelişmiş olduğunu ve sektördeki diğer çözümlerden üstün olduğunu belirtti. Bu gelişmenin, test sırasında daha büyük işlem gücünden yararlanılmasıyla mümkün olduğu açıklandı. Ancak asıl dikkat çeken nokta, OpenAI'nin o serisi modellerini eğitmek için kullandığı yeni güvenlik yaklaşımı olan “düşünsel uyum” (deliberative alignment) metodolojisi oldu.
Bu yöntemle OpenAI, o1 ve o3 modellerini, güvenlik politikalarını yanıt verme sürecinde "düşünmeleri" için eğitti. Kullanıcı bir soru sorduğunda, modelin verdiği yanıttan önce şirketin güvenlik politikasını dikkate alması sağlanıyor. OpenAI'ye göre bu yaklaşım, özellikle "güvenli olmayan" sorulara verilen yanıt oranını azaltırken, "zararsız" sorulara verilen yanıtları iyileştirdi.
Güvenlik Politikalarını Sürece Dahil Eden "Zincirleme Düşünce" Yöntemi
o1 ve o3 modellerinin bu yeni yaklaşımı, özellikle zincirleme düşünce (chain-of-thought) süreciyle dikkat çekiyor. Kullanıcı bir soru sorduğunda, model, soruyu yanıtlamadan önce bu soruyu küçük adımlara bölerek kendi iç süreçlerini tetikliyor. Bu süreçte, şirketin güvenlik politikasıyla ilgili bölümleri analiz eden model, yanıtını bu politikalara uygun şekilde şekillendiriyor.
Örneğin, OpenAI'nin bir araştırmasında, bir kullanıcı modelden sahte bir engelli otopark kartı yapmayı sorduğunda, model, OpenAI'nin politikasını göz önünde bulundurarak, bu isteğin sahtekarlık içerdiğini tespit ediyor ve talebi reddediyor.
OpenAI’nin araştırmacılarına göre, bu yöntem geleneksel güvenlik süreçlerinden farklı. Geleneksel yöntemlerde, modeller yalnızca eğitim ve sonlandırma aşamalarında güvenlik protokollerine göre eğitilirken, bu yeni yaklaşımda model, yanıt verme sürecinde de aktif olarak güvenlik politikalarını değerlendirebiliyor.
Bu habere henüz yorum yazılmamış, haydi ilk yorumu siz bırakın!...