Alibaba’nın yapay zeka modeli Qwen 2.5-Max, Çin'deki çoğu insanın tatilde olduğu ve aileleriyle vakit geçirdiği “Ay Yeni Yılı’nın” ilk günü olan bugün piyasaya sürüldü.
Batı medyasında yer alan haberlere göre, bu zamanlama, Çinli yapay zeka girişimi DeepSeek'in son üç haftada gösterdiği hızlı yükselişin, yalnızca yurt dışındaki rekabeti değil aynı zamanda iç pazarı da zorladığını gösteriyor.
Alibaba'nın bulut birimi, resmi sosyal medya hesabında yayımlanan bir açıklamada, "Qwen 2.5-Max, neredeyse her alanda GPT-4, DeepSeek-V3 ve Llama-3.1-405B'yi geride bırakıyor" ifadelerini kullandı. Bu açıklama, OpenAI ve Meta'nın en gelişmiş açık kaynaklı yapay zeka modellerine de atıfta bulundu.
fazla oku
Bu bölüm, konuyla ilgili referans noktalarını içerir. (Related Nodes field)
Deepseek’in başarısı Silikon Vadisi’ni şok etti
DeepSeek'in AI (Yapay Zeka) asistanının 10 Ocak'ta DeepSeek-V3 modeliyle, ardından 20 Ocak'ta R1 modelinin piyasaya sürülmesi, Silikon Vadisi'nde büyük bir şok etkisi yarattı ve teknoloji hisselerinin düşmesine neden oldu. Çinli girişim DeepSeek’in, düşük geliştirme ve kullanım maliyetlerinin, ABD'deki önde gelen yapay zeka firmalarının büyük harcama planlarını sorgulayan yatırımcılara ilham verdiği bildirildi.
Çin’de yapay zeka şirketlerinin rekabeti de kızıştı
Ancak DeepSeek'in başarısı, iç rekabetteki diğer rakiplerini de kendi yapay zeka modellerini geliştirmek için harekete geçirdi. DeepSeek-R1'in piyasaya sürülmesinden iki gün sonra, TikTok'un sahibi ByteDance, şirketin önde gelen ürünü Doubao isimli yapay zeka modeline bir güncelleme yayınladı. ByteDance bu modelin, Microsoft destekli OpenAI'nin o1 modelini AIME testinde (yapay zeka modellerinin karmaşık talimatları anlama ve yanıtlama yeteneklerini ölçen bir benchmark testi) geride bıraktığını iddia etti.
Bu da DeepSeek'in R1 modelinin, OpenAI'nin o1 modeline karşı birden fazla performans kriterinde rekabet edebileceği yönündeki iddiaları gündeme getirdi.
DeepSeek'in V3 modelinin selefi olan DeepSeek-V2, geçen mayıs ayında piyasaya sürüldüğünde Çinli diğer yapay zeka modeli geliştiren Alibaba arasında bir fiyat savaşı başladı. DeepSeek-V2'nin açık kaynaklı ve son derece ucuz olması (14 cent), Alibaba'nın bulut biriminin birçok modelde fiyatları yüzde 97'ye varan oranlarla indirim yapmasına yol açtı.
Diğer Çinli teknoloji şirketleri de bu adımı takip etti. Bu şirketler arasında Mart 2023’te Çin'in ChatGPT'ye karşılık gelen ilk modelini piyasaya süren Baidu (9888.HK) ve ülkenin en değerli internet şirketlerinden biri olan Tencent (0700.HK) de yer alıyor.
Liang: Yüksek temel modeller sürekli yenilik gerektirir; teknoloji devlerinin ise kapasite sınırları vardır
DeepSeek'in kurucusu Liang Wenfeng, geçen temmuz ayında Çinli medya kuruluşu Waves'e verdiği bir röportajda, girişiminin "fiyat savaşlarıyla ilgilenmediğini" ve asıl amacının AGI’yi (Yapay Genel Zeka) geliştirmek olduğunu söyledi. Alibaba gibi büyük Çinli teknoloji şirketlerinin yüz binlerce çalışanı varken; DeepSeek, esas olarak Çin'in önde gelen üniversitelerinden genç mezunlar ve doktora öğrencilerinden oluşan bir araştırma laboratuvarı olarak çalışıyor.
Liang röportajda, “Çin'in en büyük teknoloji şirketlerinin, yüksek maliyetler ve yukarıdan aşağıya doğru yapıların DeepSeek'in operasyonları ve yönetim tarzı ile karşılaştırıldığında, yapay zeka endüstrisinin geleceği için uygun olmayabileceğini düşündüğünü” belirtti. Liang, "Yüksek temel modeller sürekli yenilik gerektirir, teknoloji devlerinin kapasite sınırları vardır" dedi.
Independent Türkçe