Çin merkezli yapay zeka girişimi DeepSeek merakla beklenen V4 büyük dil modelinin ön izleme sürümünü cuma günü yayınladı. Kullanıcıların yeni yetenekleri test etmesine olanak tanıyan bu lansman, şirketin R1 modeliyle Silikon Vadisi'nde yarattığı sarsıntıdan yaklaşık bir yıl sonra geldi.
DeepSeek'in R1 modeli, şaşırtıcı performansı ve düşük maliyetiyle küresel teknoloji piyasalarını alt üst etmişti. Şirket şimdi V4 Flash ve V4 Pro serilerini tanıtarak; OpenAI, Anthropic ve Google gibi rakiplerine yeniden meydan okuyor. Önceki modellerde olduğu gibi V4 de açık kaynaklı olarak sunuluyor. Geliştiriciler kodu indirip yerel olarak çalıştırabiliyor ve çoğunlukla değişiklik yapabiliyorlar.
Kodlama ve çıkarım yeteneğinde öne çıkıyor
DeepSeek, V4 modelinin kodlama kriterlerinde, aracı tabanlı görevlerde (agentic tasks), bilgi işleme ve çıkarım yapma konularında üst düzey bir performans sergilediğini iddia ediyor. Model, boyutlarına göre "Pro" ve "Flash" olmak üzere iki versiyonla sunuluyor.
Şirket, modelin mimarisinde ve optimizasyonunda önemli güncellemeler yapıldığını Hugging Face platformunda duyurdu. DeepSeek'in "Hibrit Dikkat Mimarisi" (Hybrid Attention Architecture) adını verdiği teknikle, yapay zekanın uzun konuşmalardaki sorguları hatırlama becerisi artırıldı. Ayrıca model, 1 milyon tokenlık bağlam penceresini destekleyerek; kodların tamamının veya uzun belgelerin tek bir komutla işlenmesine olanak tanıyor.
Counterpoint Research Başkan Yardımcısı Neil Shah, CNBC'ye yaptığı açıklamada V4'ün ön izlemesinin önceki modellere göre daha düşük çıktı (inference) maliyetleri sunduğuna dikkat çekti. Çıktı maliyeti; eğitilmiş bir yapay zeka modelini çalıştırıp sonuç üretmek için gereken finansal ve işlemsel masrafları ifade ediyor. DeepSeek, V4'ün Anthropic'in Claude Code ve OpenClaw gibi popüler araçlarla çalışmak üzere optimize edildiğini de belirtti.
Counterpoint'in baş yapay zeka analisti Wei Sun ise V4'ün kriter profilinin, çok daha düşük maliyetle mükemmel aracı kapasitesi sunabileceğini söyledi. Modelin mimarisi, çıkarım maliyetlerini düşük tutmak için sadece belirli uzman alt kümelerini tetikleyen "Mixture-of-Experts" (Uzmanların Karışımı) tekniğini kullanıyor. Trilyonlarca parametreli sistem, görev başına en fazla 37 milyar parametreyi etkinleştiriyor.
R1'in piyasa etkisi tekrarlanır mı?
DeepSeek, R1 modeliyle teknoloji dünyasında fırtına estirdiğinde, şirketin sadece iki ayda ve 6 milyon dolardan daha az bir bütçeyle bu başarıya ulaştığını açıklaması yatırımcıları alarma geçirmişti. Bu durum; ABD'nin yapay zekadaki liderliğini ve dev teknoloji şirketlerinin milyarlarca dolarlık altyapı harcamalarını sorgulatmıştı. Ancak V4'ün piyasaya çıkışının R1 kadar sarsıcı olması beklenmiyor.
Morningstar Kıdemli Hisse Senedi Analisti Ivan Su'ya göre, piyasadaki aktörler Çin yapay zekasının rekabetçi ve ucuz olduğu gerçeğini çoktan fiyatladı. Fakat V4'ün konumlandırması, diğer Çinli açık kaynak modellerini doğrudan rakip haline getiriyor. Su, bu durumun iç piyasadaki rekabetin ne kadar şiddetlendiğini gösterdiğini vurguladı.
R1'in piyasaya sürülmesinden bu yana Alibaba ve ByteDance gibi devlerin yanı sıra, Zhipu ve MiniMax gibi oyuncular da kendi modellerini güncelledi. Ancak Union Bancaire Privee Genel Müdürü Vey-Sern Ling, bağımsız model sağlayıcılarının geniş bir erişime sahip internet platformlarına ve bulut servislerine karşı rekabette her zaman zorlanacağını belirtti.
Çip krizi ve ambargo tartışmaları
V4 modelinin eğitimi ve çalıştırılması için hangi çiplerin kullanıldığı konusu, lansmanın en çok tartışılan yönlerinden biri oldu. ABD'nin ihracat kontrolleri nedeniyle Çinli geliştiriciler, Nvidia'nın en gelişmiş çiplerine doğrudan erişim sağlayamıyor.
Çinli teknoloji devi Huawei, Ascend yapay zeka işlemcileriyle desteklenen bilgi işlem kümesinin V4 modelini destekleyebileceğini doğruladı. Ancak eğitim sürecinde Nvidia çipleri mi yoksa Huawei çipleri mi ağırlıklı olarak kullanıldı, henüz net değil. Counterpoint analisti Wei Sun, V4'ün yerel çiplerde çalışabilme yeteneğinin Çin'in yapay zeka bağımsızlığına ulaşmasına ve Nvidia'ya bağımlılığını azaltmasına yardımcı olabileceğini belirtti.
Bu gelişmelerin ardından Çinli çip üreticilerinin hisseleri Hong Kong borsasında yükselişe geçti. Huawei'nin ana çip üreticisi Semiconductor Manufacturing International Corp. (SMIC) yüzde 9'dan fazla, Hua Hong Semiconductor ise yüzde 13'ün üzerinde değer kazandı. Öte yandan Knowledge Atlas Technology (Zhipu) ve MiniMax hisselerinde yüzde 8, Manycore Tech hisselerinde ise yüzde 9 civarında düşüş yaşandı.
DeepSeek, hesaplama kapasitesindeki kısıtlamalar nedeniyle V4 Pro serisi için hizmet kapasitesinin şu an sınırlı olduğunu WeChat üzerinden duyurdu. Şirket, bu yılın ikinci yarısında Huawei'nin Ascend 950 çipleriyle desteklenen kümelerin devreye girmesiyle maliyetlerin önemli ölçüde düşmesini bekliyor. Öte yandan DeepSeek'in ilk finansman turu için Tencent ve Alibaba ile görüşmeler yürüttüğü ifade ediliyor.
ABD cephesinde ise DeepSeek'e yönelik eleştiriler ve incelemeler sürüyor. Amerikalı teknoloji liderleri, DeepSeek'in modellerini geliştirirken yasadışı yollar kullandığını iddia ediyor. OpenAI ve Anthropic, DeepSeek'in kendi çıktılarını kullanarak eğitim yaptığını (distillation) ileri sürüyor. Ayrıca ABD'li yetkililerin, DeepSeek'in yasaklı Nvidia çiplerine erişip erişmediğini incelediği belirtiliyor. Gelen bilgilere göre ABD hükümeti, şirketin İç Moğolistan'daki bir veri merkezinde Nvidia Blackwell işlemcilerini kullandığından şüpheleniyor.