OpenAI, ChatGPT'yi piyasaya sürdüğünden beri birçok şirket kendi AI modellerini oluşturmaya çalıştı. Ancak yalnızca bazıları öne çıkabildi. Anthropic bunlardan biri. AI girişimi, Mart ayında kendi AI modeli olan Claude'u piyasaya sürdü. OpenAI'nin GPT-3.5 ve GPT-4'üne layık bir rakip olduğunu da kanıtladı.
Anthropic şimdi de Claude'un daha hafif, daha ucuz ve daha hızlı bir versiyonu olan Claude Instant'ı da piyasaya sürdü. Anthropic, Claude'un Temmuz ayında piyasaya sürülen en son sürümü olan Claude 2.0'dan yararlanan modelin geliştirilmiş bir versiyonu olan Claude Instant 1.2'yi piyasaya sürdü. Detaylar haberimizde!
İlginizi Çekebilir: Anthropic,ChatGPT’ye Rakip Claude’u Piyasaya Sürdü
AI Modeli, Matematik ve Kodlamada Orijinalinden Daha İyi Performans Gösteriyor
Claude 2.0'ın gelişmiş yeteneklerini kullandığından, Claude Instant 1.2 matematik, kodlama, muhakeme ve güvenlikte önemli ölçüde gelişmiş ve sürüme göre daha uzun, daha yapılandırılmış yanıtlar üretiyor. Modeli teste tabi tutmak için Anthropic, Claude Instant 1.1 ve 1.2'nin performansını, matematik ve kodlama becerileri için iyi kıstaslar olan Codex değerlendirmesi ve ilkokul matematik problemleri kıyaslaması (GSM8k) dahil olmak üzere standart kıyaslama değerlendirmelerinde karşılaştırdı.
Karşılaştırma sizce nasıl oldu? Her iki durumda da 1.2 için, Codex değerlendirmesinde orijinalin yüzde 52.8'ine karşı yüzde 58.7 ve GSM8k'de orijinalin yüzde 80.9'una karşı yüzde 86.7'lik bir puanla 1.1'den daha iyi performans gösterdiğini belirtelim.
Kıyaslama sınavlarının geri kalanında ise görselde görüldüğü üzere yeni model, minimum farklarla eski modelin biraz altında veya üzerinde performans gösterdi.
Yanıt çıktısının kalitesi, azalan halüsinasyonlar ve jailbreak girişimlerine karşı artan dirençle de arttı. Red-teaming değerlendirmesi, Claude 1.2'nin kullanılabilecek en güvenli model olduğunu belirtti.
Bu habere henüz yorum yazılmamış, haydi ilk yorumu siz bırakın!...