Apple'ın DCLM-7B: 7 Milyar Parametreli Açık Kaynak Dil Modeli Yayınlandı

Apple'ın 7 milyar parametreye sahip yeni dil modeli DCLM-7B, önceki en yüksek performanslı DCLM modeli MAP-Neo'yu kriterlerde %6.6 oranında geçmeyi başardı.

Apple, yapay zeka teknolojilerine odaklanan Apple Intelligence araştırma ekibi aracılığıyla, iki yeni küçük dil modeli yayınladı. Küçük dil modellerinin popüler olduğu bu dönemde Apple'ın da bu trende katılması dikkat çekti. Küçük olmasına rağmen yüksek performans gösteren bu dil modelleri, üretken yapay zeka modellerini eğitmek için kullanılıyor.

Apple'ın Makine Öğrenimi ekibi tarafından, açık kaynaklı DataComp for Language Models (DCLM) projesi kapsamında üretilen iki model, Llama 3 ve Gemma gibi önde gelen eğitim modelleriyle yarışıyor. Bazı kriterlerde bu daha küçük modellerle benzer performans gösteren Apple'ın dil modelleri, bazı ölçütlerde ise onları geride bırakıyor.

Harvard ve Stanford gibi üniversiteler ile Toyota gibi şirketlerin yer aldığı DataComp for Language Models projesinin, en etkili veri iyileştirme stratejilerine odaklandığını belirtmekte fayda var.

Apple'ın Yayınladığı Dil Modellerinin Kullanımı

Apple'ın yeni dil modelleri, standart bir framework sağlayarak ChatGPT ya da Claude gibi yapay zeka motorlarını eğitmek için kullanılıyor. Bu bağlamda modeller, bir mimari, parametreler ve veri kümelerinin filtrelenmesini içeriyor. Veri kümelerinin filtrelenmesiyle, yapay zeka motorlarının yararlanabileceği daha yüksek kaliteli veriler sağlanıyor.

Gelecek Planları ve Erişim

Apple ekibinin yayınladığı bu modellerin, gelecekte herhangi bir Apple ürününde kullanılmak üzere tasarlanmadığını belirtmekte fayda var. Topluluk araştırma projeleri olarak konumlanan modeller, yapay zeka modellerini eğitmek için kullanılan veri kümelerinin etkin bir biçimde iyileştirilmesini amaçlıyor. Bu anlamda Apple'ın araştırma ekibi, çeşitli veri iyileştirme tekniklerinin etkisinin yanı sıra model tabanlı kalite filtreleme stratejilerini de araştırdı. Geliştiriciler, modellere Hugging Face üzerinden erişebilir.

Apple'ın Yeni Modelinin Performansı

Apple'ın DCLM dil modelleri, 7 milyar parametre ve 1.4 milyar parametre olmak üzere iki farklı büyüklüğe sahip. 7 milyar parametreye sahip olan dil modeli, önceki en yüksek performansı gösteren DCLM modeli MAP-Neo'yu kriterlerde %6.6 oranında geçmeyi başardı. Üstelik Apple ekibinin DataComp-LM modeli, bu başarıyı %40 daha az bilgi işlem gücü kullanarak gerçekleştirdi. Bu sayede model, açık veri setlerine sahip olanlar arasında en iyi performansı sergilerken, özel veri setlerine sahip olanlarla da rekabet etmeyi başardı.

Apple'ın iki modeli de Büyük Çok Görevli Dil Anlama (MMLU) ölçütünde aldığı puanlarla dikkat çekti. Yine de Apple'ın 7 milyar parametreli modeli DCLM-7B, MMLU ölçütünde Llama 3, Gemma, Phi-3 ve Qwen-2 modellerini geride bırakamadı.

Apple'ın DCLM-7B: 7 Milyar Parametreli Açık Kaynak Dil Modeli Yayınlandı

Elon Musk ile OpenAI Arasında Çekişme Devam Ediyor

Eksim Pulse Akıllı Tarım Ideathonu Başvuruları Başladı!

EduTalks Marmara Üniversitesi’nde: 6 Ocak 2025'te Buluşalım!

Galaxy AI ve Android XR: Geleceğin Teknolojileri Şimdi Hayatımızda

Bu habere henüz yorum yazılmamış, haydi ilk yorumu siz bırakın!...

Yorum Bırak:

Türkiye fintech devrimi için neler yapmalı?

MEDAŞ E.TAP Enerji Teknolojileri Hızlandırma Programı Tanıtım Webinarı ile Girişimciler Enerji Sektörüne Yön Verecek

2024 Yatırım Alan Yerli Girişimler ve Yatırımcıları

Tekmerler: Girişimcilik Ekosisteminin Neresinde?

EduTalks Etkinliği 6 Ocak’ta Marmara Üniversitesi’nde!

Selekt AI’dan 2024’te Dönüşüm ve Yeniliklerle Dolu Bir Yıl

Samsung, CES 2025’te C-Lab Start-up'larıyla Geleceğin Teknolojilerini Tanıtacak

Eksim Ventures: 2024’te 6 Girişime Yatırım, Toplamda 19 Milyon Doları Aştı!

Yemek.com, Mediazone Çatısına Katıldı

13. Girişimcilik Ekosistemi Kahvaltı Buluşması: Yılın Sonunda Ekosistemin Gücü Bir Kez Daha Görüldü! 🚀

13.Girişimcilik Ekosistemi Kahvaltı Buluşması Etkinlik Akışı Belli Oldu

13. Girişimcilik Ekosistemi Kahvaltı Buluşması: Değerli İsimler ve İlham Veren Bir Panel Sizleri Bekliyor!

Türk Hava Yolları Terminal Girişim Hızlandırma Programı Yeni Dönemi Başlıyor!

Apple'ın DCLM-7B: 7 Milyar Parametreli Açık Kaynak Dil Modeli Yayınlandı

İlgili İçerikler

Bu habere henüz yorum yazılmamış, haydi ilk yorumu siz bırakın!...

Yorum Bırak: