Araştırmacılar 50 doların altında “akıl yürütme” modeli geliştirdi

Araştırmacılar, OpenAI’nin o1 modeliyle rekabet edebilmek için 50 doların altında maliyetle yapay zeka modeli geliştirdi. “s1” adı verilen “akıl yürütme” modeli, matematik ve kodlama yetenekleri açısından OpenAI’nin o1 modeli ve DeepSeek’in R1 modeliyle benzer performans gösteriyor.

Araştırma ekibi, s1’i geliştirmek için hazır bir temel modelden yola çıkarak onu “distilasyon” yöntemiyle ince ayarladı. Bu süreç, başka bir yapay zekâ modelinin verdiği yanıtlar üzerinden “akıl yürütme” yeteneklerini çıkarmayı ve yeni modele aktarmayı içeriyor. s1, Google’ın Gemini 2.0 Flash Thinking Experimental modelinden distile edilerek oluşturuldu. Benzer bir yaklaşımı geçtiğimiz ay Berkeley Üniversitesi’nden araştırmacılar da yaklaşık 450 dolarlık bir maliyetle kullanmıştı.

Yapay zekâ alanında erişilebilirlik tartışması

s1’in düşük maliyetle geliştirilmesi, yapay zekâ modellerinin ticarileşmesiyle ilgili önemli soruları gündeme getiriyor. Çok uluslu şirketler milyonlarca dolar harcayarak ileri seviye yapay zekâ modelleri geliştirirken, bağımsız araştırmacıların benzer sonuçları çok daha düşük maliyetlerle elde edebilmesi, rekabet ortamını değiştirebilir.

Verimli bir yaklaşım: Gözetimli ince ayar (SFT)

s1’in başarısının ardında gözetimli ince ayar (Supervised Fine-Tuning – SFT) adı verilen bir yöntem bulunuyor. Bu yöntemde, model belirli bir veri kümesine dayalı olarak hedeflenen davranışları öğrenmeye yönlendiriliyor. SFT, DeepSeek’in OpenAI’nin o1 modeline rakip olarak geliştirdiği R1 modelinde kullanılan büyük ölçekli pekiştirmeli öğrenme (RL) yöntemine kıyasla daha uygun maliyetli bir alternatif olarak öne çıkıyor.

Araştırmacılar, Alibaba’ya ait Çinli yapay zekâ laboratuvarı Qwen tarafından geliştirilen, serbestçe indirilebilen küçük bir yapay zekâ modelini temel alarak s1’i eğitti. Eğitim süreci için yalnızca 1.000 dikkatle seçilmiş soru ve yanıtlarıyla birlikte, her bir yanıtın nasıl üretildiğine dair düşünme süreci kullanıldı. Eğitim süreci 16 Nvidia H100 GPU ile yalnızca 30 dakika sürdüğü ve günümüz fiyatlarıyla yaklaşık 20 dolara mal olabileceği belirtiliyor.

Basit ama etkili bir hile: ‘Bekle’ komutu

Araştırmacılar, s1’in yanıt doğruluğunu artırmak için ilginç bir teknik kullandı. Modelin daha fazla “düşünmesi” için yanıt sürecine “bekle” kelimesini ekleyerek, yanıtların doğruluğunu artırmayı başardılar. Bu küçük ama etkili müdahale, yapay zekâ modellerinin nasıl çalıştığına dair yeni içgörüler sunuyor.

Büyük yatırımlar ve yapay zekânın geleceği

Meta, Google ve Microsoft, 2025 yılına kadar yapay zekâ altyapısına yüz milyarlarca dolar yatırım yapmayı planlıyor. Bu yatırımların büyük bölümü yeni nesil yapay zeka modellerini eğitmek için kullanılacak. Distilasyon yöntemi, mevcut modellerin daha ucuz kopyalarını üretmek için etkili olsa da, yapay zekâyı bir üst seviyeye taşıyacak devrim niteliğinde yeniliklerin hâlâ büyük yatırımlara ihtiyaç duyduğu görülüyor.