Apple’ın Araştırması, Yapay Zekâ Modellerindeki Büyük Bir Zayıflığı Ortaya Çıkardı

Apple tarafından yapılan bir araştırma, OpenAI, Google ve Meta gibi devlerin kullandığı Büyük Dil Modelleri (LLM)'nin düşünüldüğü kadar gelişmiş olmadığını gösterdi. LLM'ler, mantıksal düşünme yetenekleriyle öne çıkarılsa da, araştırmalar bu yeteneklerinin sadece desen tanıma olduğunu ve gerçek anlamda bir mantıksal düşünme olmadığını ortaya koyuyor.

Yapay Zekâ Modellerinde Mantıksal Düşünce Testi

LLM'ler genellikle mantıksal düşünme yeteneklerini test etmek için GSM8K gibi popüler bir test kullanır. Ancak, bu testin yaygın kullanımı nedeniyle, modellerin bu soruların yanıtlarını zaten öğrenmiş olma riski bulunuyor. Apple araştırmacıları, bu durumu incelemek için GSM-Symbolic adlı yeni bir test geliştirdi. Bu testte, mantıksal sorunlar aynı kalmakla birlikte, isimler, rakamlar ve karmaşıklık gibi değişkenler değiştirilerek modelin gerçekten mantıksal düşünme yeteneğine sahip olup olmadığı incelendi.

Sonuçlar, tüm modellerde değişkenler değiştiğinde performansın önemli ölçüde düştüğünü gösterdi. Araştırmada, OpenAI'nın o1 modeli en iyi performansı gösterse de, yine de performansta önemli bir düşüş gözlemlendi.

Desen Tanıma mı, Gerçek Mantık mı?

Araştırmada en çarpıcı bulgulardan biri, LLM'lerin sorulara fazladan bilgi eklendiğinde başarısız olmasıydı. Örneğin, "Oliver cuma günü 44 kivi toplar. Cumartesi günü 58 kivi toplar. Pazar günü, cuma gününün iki katı kadar kivi toplar, ancak beşi ortalamadan daha küçüktür. Oliver’ın kaç kivisi var?" gibi bir soruda, modellerin anlamsız bilgiyi işlemden çıkarmakta zorlandığı ve bu nedenle sonuçların ciddi şekilde bozulduğu görüldü.

Sonuçlar ve Rakipler Arasındaki İlişki

Apple araştırmacıları, LLM'lerin matematiksel kavramları tam olarak anlayamadıklarını ve gereksiz bilgileri ayırt etmekte zorlandıklarını vurguladı. Ancak araştırmayı yapanların Apple çalışanı olduğunu ve Apple’ın Google, Meta ve OpenAI gibi rakipleriyle rekabet halinde olduğunu da belirtmek gerekiyor. Yine de bu bulgular, LLM'lerin mantıksal düşünme yetenekleri konusunda dikkatli olunması gerektiğini gösteriyor.

Apple’ın Araştırması, Yapay Zekâ Modellerindeki Büyük Bir Zayıflığı Ortaya Çıkardı

Yapay Zekâ Modellerinde Mantıksal Düşünce Testi

Desen Tanıma mı, Gerçek Mantık mı?

Sonuçlar ve Rakipler Arasındaki İlişki

Google, 2025'te Yapay Zekâ Modeli Gemini ile Liderliği Hedefliyor

Google’ın Yeni Yapay Zekâ Destekli Asistanı Glic ile Tanışın

ChatGPT Search Özelliğinde Güvenlik Açıkları Ortaya Çıktı

Google, Gemini için Claude’u Kullanıyor mu?

Bu habere henüz yorum yazılmamış, haydi ilk yorumu siz bırakın!...

Yorum Bırak:

MEDAŞ E.TAP Enerji Teknolojileri Hızlandırma Programı Tanıtım Webinarı ile Girişimciler Enerji Sektörüne Yön Verecek

2024 Yatırım Alan Yerli Girişimler ve Yatırımcıları

Tekmerler: Girişimcilik Ekosisteminin Neresinde?

EduTalks Etkinliği 6 Ocak’ta Marmara Üniversitesi’nde!

Selekt AI’dan 2024’te Dönüşüm ve Yeniliklerle Dolu Bir Yıl

Samsung, CES 2025’te C-Lab Start-up'larıyla Geleceğin Teknolojilerini Tanıtacak

Eksim Ventures: 2024’te 6 Girişime Yatırım, Toplamda 19 Milyon Doları Aştı!

Yemek.com, Mediazone Çatısına Katıldı

13. Girişimcilik Ekosistemi Kahvaltı Buluşması: Yılın Sonunda Ekosistemin Gücü Bir Kez Daha Görüldü! 🚀

13.Girişimcilik Ekosistemi Kahvaltı Buluşması Etkinlik Akışı Belli Oldu

13. Girişimcilik Ekosistemi Kahvaltı Buluşması: Değerli İsimler ve İlham Veren Bir Panel Sizleri Bekliyor!

Türk Hava Yolları Terminal Girişim Hızlandırma Programı Yeni Dönemi Başlıyor!

SAHNE XL 24 Aralık’ta BTM Fulya Yerleşkesinde!

Apple’ın Araştırması, Yapay Zekâ Modellerindeki Büyük Bir Zayıflığı Ortaya Çıkardı

Yapay Zekâ Modellerinde Mantıksal Düşünce Testi

Desen Tanıma mı, Gerçek Mantık mı?

Sonuçlar ve Rakipler Arasındaki İlişki

İlgili İçerikler

Bu habere henüz yorum yazılmamış, haydi ilk yorumu siz bırakın!...

Yorum Bırak: