Çarpıcı yetenekler OpenAI girişiminin sohbet robotu ChatGPT, yapay zekaya yönelik yeni bir ilgi ve yatırım artışını tetikledi. Ancak geçen hafta OpenAI’nin CEO’su, botu doğuran araştırma stratejisinin sona erdiği konusunda uyardı. Gelecekteki ilerlemelerin tam olarak nereden geleceği belli değil.
OpenAI, son yıllarda mevcut makine öğrenimi algoritmalarını alıp daha önce hayal edilemeyen boyutlara ölçeklendirerek yapay zekada dille çalışan bir dizi etkileyici ilerleme sağladı. Bu projelerin en sonuncusu olan GPT-4, muhtemelen trilyonlarca kelimelik metin ve binlerce güçlü bilgisayar çipi kullanılarak eğitildi. Süreç 100 milyon dolardan fazlaya mal oldu.
Ancak şirketin CEO’su Sam Altman, modelleri büyütmekle daha fazla ilerleme sağlanamayacağını söylüyor. Geçen hafta MIT’de düzenlenen bir etkinlikte bir izleyici kitlesine, “Bence bu, dev gibi dev modellerin olacağı çağın sonundayız” dedi. “Onları başka şekillerde daha iyi hale getireceğiz.”
Altman’ın beyanı, yeni yapay zeka algoritmaları geliştirme ve dağıtma yarışında beklenmedik bir dönüşe işaret ediyor. OpenAI, Kasım ayında ChatGPT’yi başlattığından beri Microsoft, Bing arama motoruna bir sohbet robotu eklemek için temeldeki teknolojiyi kullandı ve Google, Bard adlı rakip bir sohbet robotunu piyasaya sürdü. Pek çok kişi, işte veya kişisel görevlerde yardımcı olması için yeni tür sohbet robotlarını kullanmayı denemek için acele etti.
Bu arada, Anthropic, AI21, Cohere ve Character.AI dahil olmak üzere çok sayıda iyi finanse edilen girişim, OpenAI teknolojisine yetişmek için çok daha büyük algoritmalar oluşturmak için muazzam kaynaklar harcıyor. ChatGPT’nin ilk sürümü, GPT-3’ün biraz yükseltilmiş bir sürümüne dayanıyordu, ancak kullanıcılar artık daha yetenekli GPT-4 tarafından desteklenen bir sürüme de erişebilirler.
Altman’ın açıklaması, GPT-4’ün OpenAI’nin modelleri büyütme ve onlara daha fazla veri besleme stratejisinden ortaya çıkan son büyük ilerleme olabileceğini öne sürüyor. Onun yerini ne tür araştırma stratejilerinin veya tekniklerinin alabileceğini söylemedi. GPT-4’ü açıklayan makalede OpenAI, tahminlerinin model boyutunu büyütmenin getirilerinin azaldığını gösterdiğini söylüyor. Altman, şirketin kaç tane veri merkezi kurabileceği ve bunları ne kadar hızlı kurabileceği konusunda da fiziksel sınırlar olduğunu söyledi.
Daha önce Google’da AI üzerinde çalışmış olan Cohere’in kurucu ortaklarından Nick Frosst, Altman’ın daha büyük olmanın sonsuza kadar işe yaramayacağına dair hissinin doğru olduğunu söylüyor. O da GPT-4 ve rakiplerinin kalbinde yer alan makine öğrenimi modeli türü olan transformatörlerdeki ilerlemenin ölçeklendirmenin ötesinde olduğuna inanıyor. “Transformatörleri çok ama çok daha iyi ve daha kullanışlı hale getirmenin birçok yolu var ve bunların çoğu modele parametre eklemeyi gerektirmiyor” diyor. Frosst, yeni AI model tasarımlarının veya mimarilerinin ve insan geri bildirimlerine dayalı daha fazla ayarlamanın, birçok araştırmacının zaten keşfetmekte olduğu umut verici yönler olduğunu söylüyor.
OpenAI’nin etkili dil algoritmaları ailesinin her sürümü, nöronların birlikte çalışma biçiminden genel olarak ilham alan ve belirli bir metin dizisini takip etmesi gereken kelimeleri tahmin etmek için eğitilmiş bir yazılım olan yapay bir sinir ağından oluşur.
Bir yanıt bırakın