DeepSeek'in yapay zekasına Çin çipi engeli
DeepSeek'in yeni yapay zeka modeli Huawei'nin yarı iletkenleriyle eğitmenin zorluğu nedeniyle ertelendi. Bu durum Çinli girişimin Nvidia'ya olan bağımlılığını ortaya koyuyor.
14 Ağustos 2025, 17:00
Çinli yapay zeka şirketi DeepSeek, Huawei'nin çiplerini kullanarak yeni modelini eğitmeyi başaramayınca, modelin piyasaya sürülmesini erteledi. Bu durum, Pekin'in ABD teknolojisini ikame etme çabalarının sınırlarını ortaya koydu. Financial Times'a konuşan konuya yakın üç kişiye göre DeepSeek, ocak ayında R1 modelini piyasaya sürdükten sonra, yetkililer tarafından Nvidia sistemlerini kullanmak yerine Huawei'nin Ascend işlemcisini benimsemeye teşvik edildi.
Ancak Çinli start-up, Ascend çiplerini kullanarak R2 eğitim sürecinde sürekli teknik sorunlarla karşılaştı ve bu da onu eğitim için Nvidia çiplerini, çıkarım için ise Huawei çiplerini kullanmaya yöneltti. Durumu bilen bir kişi, bu sorunların modelin mayıs ayında piyasaya sürülmesinin ertelenmesinin ana nedeni olduğunu ve bunun da rakip firmalara karşı avantajını kaybetmesine neden olduğunu söyledi.
İki kişiye göre Huawei, DeepSeek'in ofisine bir mühendis ekibi göndererek şirketin YZ çipini kullanarak R2 modelini geliştirmesine yardımcı oldu. Ancak bu ekip yerinde olmasına rağmen, DeepSeek Ascend çipinde başarılı bir eğitim çalışması gerçekleştiremediğini belirtti. DeepSeek, modeli Ascend ile uyumlu hale getirmek için Huawei ile birlikte çalışmaya devam ediyor.
Kaliforniya Üniversitesi, Berkeley'de yapay zeka araştırmacısı olan Ritwik Gupta, “Modeller kolayca değiştirilebilen ürünlerdir. Birçok geliştirici, güçlü ve esnek olan Alibaba'nın Qwen3'ünü kullanıyor” dedi. Gupta, Qwen3'ün DeepSeek'in temel kavramlarını, örneğin modeli akıl yürütme yeteneği kazandıran eğitim algoritmasını benimsediğini ancak bunları daha verimli hale getirdiğini belirtti.
Pekin ve Washington arasındaki jeopolitik mücadelenin merkezinde yer alan yonga üreticisi Nvidia, Çin'e H20 yongalarının satışını yeniden başlatmak için ABD hükümetine Çin'deki gelirlerinin bir kısmını vermeyi kabul etti. Nvidia, yongalarını kullanan Çinli şirketler hakkında “Geliştiriciler, başarılı bir yapay zeka ekosisteminin oluşturulmasında çok önemli bir rol oynayacaklar. Tüm pazarları ve geliştiricileri teslim etmek, yalnızca Amerikan ekonomisine ve ulusal güvenliğine zarar verecektir” dedi.
Ancak Çinli start-up, Ascend çiplerini kullanarak R2 eğitim sürecinde sürekli teknik sorunlarla karşılaştı ve bu da onu eğitim için Nvidia çiplerini, çıkarım için ise Huawei çiplerini kullanmaya yöneltti. Durumu bilen bir kişi, bu sorunların modelin mayıs ayında piyasaya sürülmesinin ertelenmesinin ana nedeni olduğunu ve bunun da rakip firmalara karşı avantajını kaybetmesine neden olduğunu söyledi.
Pekin gerekçe bildirmelerini istedi
Eğitim, modelin büyük bir veri kümesinden öğrenmesini içerirken çıkarım, eğitilmiş bir modeli kullanarak tahminlerde bulunma veya sohbet robotu sorgusu gibi bir yanıt üretme adımını ifade ediyor. DeepSeek'in karşılaştığı zorluklar, Çinli çiplerin kritik görevlerde ABD'li rakiplerinin hala gerisinde olduğunu göstererek, Çin'in teknolojik olarak kendi kendine yeterlilik hedefine ulaşma yolunda karşılaştığı zorlukları ortaya koyuyor. Financial Times bu hafta, Pekin'in Çinli teknoloji şirketlerinden Nvidia'nın H20 ürünlerini sipariş etmelerinin gerekçesini açıklamalarını talep ettiğini ve bu hamleyle Huawei ve Cambricon tarafından üretilen alternatif ürünleri teşvik etmeyi amaçladığını yazdı. Sektör uzmanları, Çinli çiplerin Nvidia ürünlerine kıyasla kararlılık sorunları, daha yavaş çip arası bağlantı ve daha düşük kaliteli yazılım sorunları yaşadığını belirtiyor.İki kişiye göre Huawei, DeepSeek'in ofisine bir mühendis ekibi göndererek şirketin YZ çipini kullanarak R2 modelini geliştirmesine yardımcı oldu. Ancak bu ekip yerinde olmasına rağmen, DeepSeek Ascend çipinde başarılı bir eğitim çalışması gerçekleştiremediğini belirtti. DeepSeek, modeli Ascend ile uyumlu hale getirmek için Huawei ile birlikte çalışmaya devam ediyor.
Yakında piyasaya sürülecek
Kurucu Liang Wenfeng, şirket içinde R2'nin ilerlemesinden memnun olmadığını ve şirketin YZ alanında liderliğini sürdürebilecek gelişmiş bir model oluşturmak için daha fazla zaman harcamaya çalıştığını söyledi. Başka bir kaynak, R2'nin piyasaya sürülmesinin, güncellenmiş modelinin veri etiketleme sürecinin beklenenden uzun sürmesi nedeniyle de ertelendiğini ekledi. Çin medyasında yer alan haberlere göre model gelecek haftalarda piyasaya sürülebilir.Kaliforniya Üniversitesi, Berkeley'de yapay zeka araştırmacısı olan Ritwik Gupta, “Modeller kolayca değiştirilebilen ürünlerdir. Birçok geliştirici, güçlü ve esnek olan Alibaba'nın Qwen3'ünü kullanıyor” dedi. Gupta, Qwen3'ün DeepSeek'in temel kavramlarını, örneğin modeli akıl yürütme yeteneği kazandıran eğitim algoritmasını benimsediğini ancak bunları daha verimli hale getirdiğini belirtti.
Pekin ve Washington arasındaki jeopolitik mücadelenin merkezinde yer alan yonga üreticisi Nvidia, Çin'e H20 yongalarının satışını yeniden başlatmak için ABD hükümetine Çin'deki gelirlerinin bir kısmını vermeyi kabul etti. Nvidia, yongalarını kullanan Çinli şirketler hakkında “Geliştiriciler, başarılı bir yapay zeka ekosisteminin oluşturulmasında çok önemli bir rol oynayacaklar. Tüm pazarları ve geliştiricileri teslim etmek, yalnızca Amerikan ekonomisine ve ulusal güvenliğine zarar verecektir” dedi.