6 maddede Silikon Vadisi'ni sarsan DeepSeek

Çin merkezli şirket, Batılı muadillerini geride bırakarak "şok dalgası" yarattı

DeepSeek'in çıkışı, ABD'li şirketlerde yüzlerce milyar dolarlık kayba yol açtı (Dado Ruvic/Reuters)

Dünyanın en değerli şirketini tarihi bir kayba uğrattı, hisseleri alt üst etti ve bazılarına göre yapay zekada yeni bir çağ başlattı. 

Henüz iki yaşını bile doldurmayan Çin merkezli bir şirket, Silikon Vadisi'ne şok dalgaları göndererek teknolojiyle yakından uzaktan ilgisi olan kimsenin son birkaç gündür başka bir şey konuşmasına izin vermiyor.

DeepSeek'in birkaç hafta arayla piyasaya sürdüğü iki ayrı modeli, hem performansı hem inanılmayacak kadar ucuza mal edilip satılmasıyla dünya çapında endişe, korku, merak ve heyecan yaratıyor.

ABD'yle Çin arasındaki teknoloji savaşında yeni bir sayfa açan gelişmeler, Batı'nın üstünlüğü elinde tutmak için kısıtlamalar dışında yöntemler bulması gerektiği düşüncesini beraberinde getiriyor.

Logos'ta bu hafta DeepSeek'in yarattığı sarsıntıyı, yapay zekanın geleceği için ne anlama geldiğini, yeni modellerle ilgili iddiaları ve güvenliklerine dair endişeleri tüm yönleriyle masaya yatırıyoruz.

1) DeepSeek: OpenAI'ın en büyük rakibi 

Çin'in Hangzhou kentinde 2023'te kurulan DeepSeek, ilk yapay zeka geniş dil modelini aynı yıl piyasaya sürdü. 

Ancak sırayla Aralık 2024 ve geçen hafta kullanıma sunduğu V3 ve R1 modellerinin, OpenAI gibi devlerin araçlarını geride bıraktığı iddialarına kadar pek dikkat çekmedi.

V3 modeliyle desteklenen yapay zeka aracı, dün (27 Ocak Pazartesi) itibarıyla ABD'de en çok indirilen iPhone uygulamasıydı. 

ABD merkezli şirketlerle yarışan modelleri daha ucuza geliştirip sattığını öne süren DeepSeek, Nvidia'dan Microsoft'a kadar teknoloji devlerinin yüzlerce milyar dolar değer kaybetmesine neden oldu

fazla oku

Bu bölüm, konuyla ilgili referans noktalarını içerir. (Related Nodes field)

Bağımsız testlerde V3, OpenAI'ın GPT-4o ve Anthropic'in Claude Sonnet 3.5 gibi araçlarının performansını yakaladı ve Meta'nın Llama 3.1'i ve Alibaba'nın Qwen2.5'ini de geride bıraktı

DeepSeek, V3 modelini sadece iki ay içinde 6 milyon dolardan daha düşük fiyata eğitildiğini iddia ediyor. Ayrıca bunu Nvidia'nın daha az gelişmiş H800 çiplerinden sadece 2 bin adet kullanarak yaptığını savunuyor. 

Buna karşın OpenAI'ın GPT-4'ü geliştirmek için 80-100 milyon dolar civarında para harcadığı tahmin ediliyor. Diğer yandan uzmanlar, V3'ü geliştirmek için harcanan miktarın 6 milyonun daha üstünde olduğunu ve bu paranın sadece bilgi işlem gücü için harcandığını ifade ediyor.

DeepSeek'e göre 20 Ocak Pazartesi günü piyasaya sürülen R1 ise pek çok testte OpenAI'ın o1'inden daha iyi performans sergiledi.

Bu iki araç, V3 veya ChatGPT gibi modellerden farklı olarak "düşünebilen" veya "mantık  yürüten" yapay zeka modelleri olarak adlandırılıyor. 

Kendi doğruluklarını kontrol eden bu modellerin, cevap verme süresi uzasa da hata yapma ihtimali epey düşüyor. Bu açıdan özellikle bilimsel çalışmalarda öne çıkıyorlar.

R1'in geliştirilmesine ne kadar para veya çip harcandığı net bir şekilde bilinmiyor. Ancak modelin açık kaynak olarak yayımlanması, kodunun incelenip değiştirilmesine imkan tanıyor.

DeepSeek modelin nasıl eğitildiği gizli tutmasına karşın açık kaynak özelliğiyle de her şeyi kapalı kapılar ardında saklayan OpenAI'a rakip olduğu söylenebilir. 

Çinli şirket ayrıca iki modelini de ABD'li rakibinden çok daha ucuza kullanıma sunuyor. 

Bütün bunlar göz önüne alınınca yapay zeka sektörüne gerçekten bu kadar para harcanmasına gerek olup olmadığı sorusu teknoloji gündeminin merkezine oturdu. 

2) Nvidia'dan tarihi kayıp

Son yıllarda yapay zeka çalışmalarındaki patlamayla çip satışlarında fırlama yaşayan Nvidia, dünyanın en değerli şirketi haline bile gelmişti.

Ancak kendisini tahtından indiren de yine yapay zeka oldu.

DeepSeek'in yarattığı dalganın etkisiyle Nvidia'nın hisseleri pazartesi günü yüzde 17 değer kaybetti.

Forbes'a göre piyasa değerinde 589 milyar dolar kaybeden şirket, ABD tarihindeki herhangi bir şirketin bir günde yaşadığı en büyük değer kaybına imza attı. 3 Eylül 2024'te 279 milyar dolar değer kaybeden Nvidia, önceki rekorun da sahibiydi.

Son gelişmeyle birlikte çip üreticisi en değerli şirket ünvanını da tekrar Apple'a teslim etti.

Yatırımcıların, daha az çiple gelişmiş yapay zeka modelleri üretilebileceği endişesinden kaynaklanan krizden en çok Nvidia etkilenmesine karşın diğer şirketler de durumdan nasibini aldı.

Google'ın çatı şirketi Alphabet 100 milyar dolara yakın değer kaybı yaşarken, Microsoft da 7 milyar civarında kayba uğradı.

Nvidia'nın rakibi Advanced Micro Devices'ın hisseleriyse yüzde 6'dan fazla düşüş yaşadı.

Diğer yandan Nvidia, DeepSeek'le ilgili gelişmelerin, kendi çiplerinin ne kadar işe yaradığını gösterdiğini düşünüyor.

Kaliforniya merkezli şirket dün yaptığı açıklamada R1 modelinin "mükemmel bir yapay zeka gelişmesi" olduğunu ifade ederek şöyle ekledi:

DeepSeek'in çalışması, bu tekniği kullanarak ve yaygın olarak kullanılabilen modellerden ve ihracat kontrolüne tamamen uygun hesaplamalardan yararlanarak yeni modellerin nasıl yaratılabileceğini gösteriyor.

3) ABD ve Çin'in soğuk savaşı: "Yapay zekanın Sputnik anı"

Pek çok uzmana göre DeepSeek, ABD'nin çip kısıtlamalarının Çin teknolojilerine ket vurmak yerine daha fazla gelişmesine neden olduğunun kanıtı. 

Yapay zeka ve savunma teknolojileri yarışında öne geçmek isteyen ABD, ilk olarak Ekim 2022'de gelişmiş çip ve işlemcilerin Çin'e satışına kısıtlamalar getirmişti.

Görevden yeni ayrılan Joe Biden yönetimi, bu kısıtlamaların kapsamını genişletmeyi amaçlayan yeni düzenlemeler önererek kararı Donald Trump iktidarına bıraktı.

Henüz net bir açıklama yapılmadı ancak Trump, "mevcut ihracat kontrollerindeki boşlukları tespit edip ortadan kaldırmaya" yönelik bir karar imzalayarak Biden'ın önerisini kabul edeceği sinyali verdi.

Ancak DeepSeek'in son atılımları bu kısıtlamaların pek işe yaramadığını düşündürüyor. Şirket her ne kadar Nvidia ürünlerini kullansa da en azından V3, daha az gelişmiş çiplerle geliştirildi.

Daha önce Çin'in en büyük serbest yatırım fonlarından High-Flyer'ın kurucu ortaklarından biri olan DeepSeek CEO'su Liang Wenfeng'in kısıtlamalardan önce, 10 bin adet Nvidia A100 grafik işlemci çipi aldığı söyleniyor. 

V3'ün arkasındaki H800'ün Çin'e satışıysa 2023'te yasaklanmıştı.

Liang, 2024'te yaptığı bir açıklamada "Yaşadığımız sorun hiçbir zaman finansman olmadı; gelişmiş çiplerin ihracat kontrolü oldu" demişti.

Fakat uzmanlar, ABD kısıtlamalarının Çinli bilim insanlarını daha yenilikçi yöntemler arayışına ittiğini ve DeepSeek'in de bunun göstergesi olduğunu düşünüyor.

ABD'deki Stratejik ve Uluslararası Çalışmalar Merkezi'nden Gregory Allen ise "Teknoloji yeniliği gerçek ancak piyasaya sürülme zamanlaması doğası gereği politik" diyor:

İhracat kontrollerinin boşuna olduğunu ya da ters etki yarattığını göstermeye çalışmak şu anda Çin dış politikasının gerçekten önemli bir hedefi.

DeepSeek'in yarattığı etkiyle ilgili en ilgi çekici yorumlardan biriyse teknoloji yatırımcısı Marc Andreessen'den geldi. Andreessen, Sovyetler Birliği'yle ABD arasındaki Soğuk Savaş dönemindeki uzay keşfi yarışını başlatan olaya atıf yaparak "Deepseek R1, yapay zekanın Sputnik anı" dedi.

 


Trump'a teknoloji politikaları danışmanlığı yapan yatırımcı, ABD'nin yapay zeka endüstrisini aşırı düzenlemesinin kendi şirketlerini engelleyeceğine ve Çin'in öne geçmesini sağlayacağına dair uyarıyor.

ABD Başkanı Trump ise DeepSeek'in ABD şirketleri için bir "uyandırma çağrısı" olduğunu söylüyor. 20 Ocak'ta başkanlık koltuğuna oturan Trump, dün yaptığı açıklamada "Çin ve Çin'deki bazı şirketler hakkında bir şeyler okuyorum, özellikle bir tanesi daha hızlı ve çok daha ucuz bir yapay zeka yöntemi geliştiriyor" diyerek ekledi: 

Bu iyi bir şey çünkü çok fazla para harcamanız gerekmiyor. Ben bunu olumlu ve değerli bir şey olarak görüyorum.

4) Yapay zekanın geleceğini nasıl etkileyecek?

Trump'ın sözünü ettiği gibi DeepSeek'in hamlesi, yapay zeka modellerinin daha düşük fiyata geliştirilebileceğini gösteriyor. 

Ancak şirketin etkisi bununla sınırlı değil.

Modellerin uygun fiyata sunulmasının yanı sıra açık kaynaklı olmasının, yapay zeka modelleri geliştirmede demoktatikleştirici bir etki yaratacağını düşünenler var.

Bunlara R1'in daha az gelişmiş versiyonlarının dizüstü bilgisayarlarda çalışması da eklenince, sektörün daha geniş bir kitlenin erişimine açılması bekleniyor.

Henüz net bir şey söylemek için erken ama kısa süre içinde daha küçük girişimlerin yapay zeka alanına girmeye başladığını görebiliriz.

Bunların yanı sıra DeepSeek, diğer şirketlerin fiyatları düşürmesine de yol açabilir. 

Diğer yandan pazar araştırma şirketi eMarketer'dan Gadjo Sevilla, "OpenAI gibi (kâr için bastıran) pazar liderlerinin kısa vadede fiyatlandırmayı düşürmesi pek olası değil" diyerek ekliyor:

Muhtemelen kurumsal kullanıcılar için önemli olan temel farklılaştırıcı özellikler olarak güvenlik üzerinde duracaklar.

5) Güvenlik ve sansür endişeleri

Çin'in kişisel verileri çaldığı iddiaları, bazılarının DeepSeek'e çekimser yaklaşmasına neden oluyor.

Şirketin kullanıcı bilgilerini Çin'deki sunucularda sakladığını belirtmesinin, teknolojinin ABD'de benimsenmesine engel olacağını düşünenler var.

Ancak DeepSeek'in verileri saklayan tek şirket olduğu söylenemez. OpenAI, yeni piyasaya sürdüğü Operator'da kullanıcılar konuşmayı silse bile verileri 90 güne kadar saklayabileceğini duyurmuştu.

Ayrıca ChatGPT'deki konuşmalar da aracı geliştirmek için kullanılabiliyor. 

DeepSeek'e yönelik bir diğer endişeyse taraflı davranması. Çin merkezli modeller, "temel sosyalist değerleri içermesi" gerektiği için Tayvan'ın özerkliği gibi belirli konular hakkında yanıt vermiyor. Ancak Ars Technica'ya göre model bulutta değil, Çin dışında yerel olarak çalıştırıldığında böyle bir sınırlama yaşanmıyor

Bazıları bu şekilde uygulanan sansürün, yapay zekanın yanlış cevaplar üretmesinden daha kötü olduğunu düşünüyor.

6) DeepSeek yalan mı söylüyor?

DeepSeek'in yeni modellerinin sergilediği performansı ölçen testlerin güvenli olmadığını öne sürenler var.

Ayrıca şirketin, modelleri bu testleri geçecek şekilde eğittiği ihtimali de tartışılıyor.

Bu iddiaların doğruluğu hakkında net bir şey söylemek henüz mümkün değil. Ancak diğer şirketlerin araçlarının da benzer testlere tabi tutulduğunu söylemekte fayda var. Uzmanlar bu testlerin her zaman gerçek kullanımdaki performansı yansıtmayabileceğini ifade ediyor.

Şirkete yönelik bir diğer suçlamaysa, modelini aslında 50 bin adet NVIDIA H100 çipiyle geliştirdiği ancak ihracat kısıtlamaları nedeniyle bunu açıklayamadığı yönünde.

Teknoloji milyardei Elon Musk da bu iddialar hakkında "Belli ki öyle" diyerek görüşünü ifade etti.

 


Çin merkezli şirketin başarısıyla ilgili en çarpıcı soru işaretlerinden biriyse kendisini ChatGPT sanması.

TechCrunch'ın geçen ay aktardığı üzere V3'e hangi model olduğunu soran kullanıcılar "Ben ChatGPT'yim" yanıtını alıyor. Bu durum, V3'ün eğitiminde kullanılan verilere dair soru işaretleri yaratıyor.

DeepSeek, V3'ün eğitim verilerinin kaynağı hakkında fazla bilgi vermiyor. Ancak GPT-4'ün ürettiği halka açık metinleri içeren verilerle eğitildiyse, model GPT-4'ün çıktılarından bazılarını ezberlemiş ve bunları tekrarlıyor olabilir.

Uzmanlar bunun kazayla yaşanabileceğini ancak kasten OpenAI aracının verisiyle eğitilmiş olabileceğini de söylüyor.

OpenAI, kendisiyle rekabet eden modeller geliştirmek için araçlarının yanıtlarını kullanmaya izin vermiyor.

© The Independentturkish

DAHA FAZLA HABER OKU