Çinli teknoloji şirketi Alibaba, Çarşamba günü Qwen 2.5 adlı yapay zeka modelinin yeni bir sürümünü piyasaya sürdü ve bunun son günlerde büyük beğeni toplayan DeepSeek-V3’ü geride bıraktığını iddia etti.
Qwen 2.5-Max’in Çin’in Ay Yeni Yılı’nın ilk tatil gününde piyasaya sürülmesi dikkat çekti. Bu sıra dışı zamanlama son üç haftada hızla yükselen Çinli yapay zeka girişimi DeepSeek’in yalnızca yabancılar için değil aynı zamanda yerel rakipleri üzerinde de baskı oluşturduğunu gösteriyor.
Alibaba’nın teknoloji birimi, WeChat hesabında yaptığı duyuruda “Qwen 2.5-Max, GPT-4o, DeepSeek-V3 ve Llama-3.1-405B modellerini neredeyse tüm performans kriterlerinde geride bırakıyor,” diye yazdı. Yani OpenAI ve Meta’nın en gelişmiş açık kaynak yapay zeka modellerine atıfta bulunuldu.
DeepSeek’in DeepSeek-V3 modeliyle güçlendirilmiş yapay zeka asistanının 10 Ocak’ta, R1 modelinin ise 20 Ocak’ta piyasaya sürülmesi Silikon Vadisi’nde şok etkisi yaratmıştı.
Bu gelişme ABD’de teknoloji hisselerinin değer kaybetmesine neden oldu. DeepSeek’in çok düşük düzeydeki geliştirme ve kullanım maliyetleri, ABD’deki önde gelen yapay zeka şirketlerinin yüksek harcama planlarının yatırımcılar nezdinde sorgulanmasına yol açtı.
Ancak DeepSeek’in başarısı yerel rakipleri arasında da kendi modellerini güncelleme yarışı başlattı.
DeepSeek-R1’in piyasaya sürülmesinden iki gün sonra, TikTok’un sahibi ByteDance, Microsoft destekli OpenAI’ın o1 modelini ‘AIME’ testinde geride bıraktıklarını iddia ederek kendi amiral gemisi olan yapay zeka modelini güncelledi.
DeepSeek ve yerel rakipleri
DeepSeek’in V3 modelinin selefi olan DeepSeek-V2, Mayıs 2024’te piyasaya sürüldüğünde Çin’de yapay zeka modellerinde fiyat savaşlarını tetikledi.
DeepSeek-V2’nin açık kaynaklı olması ve benzeri görülmemiş şekilde düşük fiyatla hizmet vermesi Alibaba’nın bulut biriminin modellerinde yüzde 97’ye varan fiyat indirimleri açıklamasına neden oldu.
Diğer Çinli teknoloji şirketleri de bu adımı izledi. Mart 2023’te Çin’in ChatGPT ‘benzeri’ni piyasaya süren Baidu ve ülkenin en değerli internet şirketi Tencent de bu gelişmeye dahil oldu.
DeepSeek’in gizemli kurucusu Liang Wenfeng, Temmuz ayında Çinli medya kuruluşu Waves ile röportajında fiyat savaşlarını umursamadıklarını ve asıl hedeflerinin AGI (yapay genel zeka) olduğunu belirtti.
AGI, insan benzeri zekaya ve kendi kendine öğretme yeteneğine sahip yazılımlar oluşturmaya çalışan bir teorik yapay zeka araştırma alanı. Amaç yazılımın üzerinde mutlaka eğitilmediği veya geliştirilmediği görevleri yerine getirebilmesidir.
OpenAI, AGI’yi ekonomik açıdan değerli görevlerin çoğunda insanları aşan otonom sistemler olarak tanımlıyor.
Alibaba gibi büyük Çinli teknoloji şirketlerinin yüz binlerce çalışanı varken, DeepSeek daha çok bir araştırma laboratuvarı gibi çalışıyor ve ekibinde çoğunlukla Çin’in en iyi üniversitelerinden mezun gençler ve doktora öğrencileri bulunuyor.
Liang, temmuz ayında yaptığı açıklamada, Çin’in en büyük teknoloji şirketlerinin yüksek maliyetleri ve yukarıdan aşağıya yönetim yapıları nedeniyle yapay zeka endüstrisinin geleceğine uygun olmayabileceğini düşündüğünü söyledi: “Büyük temel modeller sürekli inovasyon gerektiriyor; teknoloji devlerinin yeteneklerinin de sınırları var.”