DeepSeek ve açık kaynak modeller yapay zeka dünyasını nasıl sarsıyor?
Teknoloji şirketleri ve akademisyenler, uzun zamandır açık kaynak yazılım geliştirmenin riskleri ve faydaları üzerine kafa yoruyor. Ancak üretken yapay zeka etrafında yaşanan çılgınlık, bu tartışmaya yeni bir boyut kazandırdı.
07 Ağustos 2025, 12:20
DeepSeek ve diğer Çinli şirketler, önde gelen Amerikalı yapay zeka geliştiricilerinin yazılımlarına rakip, düşük maliyetli açık kaynak modelleri piyasaya sürdü. Buna karşılık olarak, önde gelen bir Amerikan yapay zeka şirketi olan OpenAI, altı yıl sonra ilk kez yeni bir açık model yayımladı. ABD’deki Donald Trump yönetimi ise daha fazla Amerikan teknoloji şirketine aynısını yapmaları çağrısında bulundu. İşte bilinmesi gerekenler:
Bir yapay zeka modelinin gerçekten açık olarak kabul edilebilmesi için OSI’ye göre geliştiricilerin modelin eğitildiği veriler hakkında ayrıntılı bilgi sunması ve insanların bu sistemi herhangi bir amaç için inceleyebilmesine, kullanabilmesine ve değiştirebilmesine imkan tanıması gerekir. Buna karşılık kapalı kaynak, geliştiricinin kontrolünde olan, değiştirilemeyen ve teknik yapısı konusunda daha az şeffaflık sunan yazılım ve modelleri ifade eder.
Örneğin Meta, Llama adlı yapay zeka modelleri serisi için bazı kaynak kodları sunuyor ancak eğitim verileri hakkında ayrıntılı bilgi sağlamıyor. Ayrıca Meta, OSI tarafından daha önce ticari kullanımlara yönelik bazı kısıtlamalar içeren lisanslama koşulları nedeniyle eleştirilmişti. Benzer şekilde DeepSeek, ocak ayında en yeni sistemi olan R1’i açık kaynak model olarak yayımladığını söyledi ancak kod ya da eğitim verisi sunmadı. Bu da şirketin modelini tam olarak neyle inşa ettiği konusunda soru işaretlerine yol açtı. Adında 'açık' ifadesi geçmesine rağmen, OpenAI modellerinin çoğunu açık kaynak yapmıyor. Ancak DeepSeek’in viral başarısının ardından, OpenAI CEO’su Sam Altman, ChatGPT geliştiricisinin “farklı bir açık kaynak stratejisi” geliştirmesi gerektiğini kabul etti. Şöyle ekledi: Bence şahsen burada tarihin yanlış tarafında kaldık.
Ağustos ayında OpenAI, GPT-oss-120b ve GPT-oss-20b adlı, Llama’ya benzer açık ağırlıklı sistemlerden oluşan iki model yayımladı. Bu modeller, yapay zeka yazılım barındırma platformu Hugging Face üzerinden ücretsiz olarak sunuluyor. Modeller, insan akıl yürütmesini taklit edebilir ve kullanıcı komutlarına metin üreterek cevap verebilir ancak görsel ya da video oluşturamazlar.
Kapalı sistemler, yapay zeka pazarının yalnızca birkaç güçlü şirketin egemenliği altına girmesi riskini taşır. Bulut depolama şirketi Box'ın CEO’su Aaron Levie şöyle diyor: Çok pahalı ve özel yapay zeka dünyasında, yapay zeka sağlayıcıları tüm ekonomik getiriyi kendilerine saklamayı seçebilir. Bu da geliştiriciler ve ekosistem için fırsatların ortadan kalkması anlamına gelir.
Meta gibi şirketler için açık kaynak olmanın bir diğer avantajı da popülerlik. Diğer geliştiricilerin açık kaynak yazılımlara erişip üzerine inşa edebilmesine izin vererek, Meta yapay zeka ekosistemi içinde etkisini genişletmeyi başardı.
Başka bir deyişle, DeepSeek aslında Meta’nın yapay zeka ekosisteminde daha fazla yer kaplamak için izlediği stratejiyi takip etti ve bu durum, Meta CEO’su Mark Zuckerberg’in dikkatinden kaçmamış gibi görünüyor. Zuckerberg, The Joe Rogan Experience programındaki bir röportajda, “Bu büyük bir jeopolitik rekabet ve Çin bu işin üstüne çok ciddi şekilde gidiyor. Eğer herkesin kullanacağı açık kaynak bir model olacaksa, bunun Amerikan modeli olmasını istemeliyiz" ifadelerini kullandı.
Modelin arkasındaki ekip yenilikçi bir şekilde çalıştı. Rakipler benzer yapay zeka modelleri inşa etmek için büyük miktarda yüksek güçlü bilgisayar çipi kullanırken, DeepSeek ekip üyeleri, ABD'nin en ileri düzey çiplerin ihracatını kısıtlaması nedeniyle erişebildikleri daha az gelişmiş ve sayıca az olan çipleri verimli şekilde kullanmanın yollarını bulmuş görünüyor. Ayrıca, doğru cevaplar için ödül, yanlış cevaplar için ceza veren bir teknik olan pekiştirmeli öğrenme yöntemine büyük ölçüde bel bağladılar. ABD’de bazı teknoloji ve politika liderleri bu gelişmeleri kabul ederken, Çinli şirketin sohbet botunu geliştirirken Batı teknolojisinden faydalanarak büyük dil modelleri geliştirme sürecinin yüksek maliyetlerinden kaçınıp kaçınmadığı sorusunu da gündeme getirdi.
Açık kaynak nedir?
Genel olarak, açık kaynak; kaynak kodu herkesin kullanımına veya değiştirmesine açık olan yazılımları ifade eder. Bu çalışma yönteminin faydalarını savunan, Kaliforniya merkezli kar amacı gütmeyen bir kuruluş olan Open Source Initiative’e (OSI) göre bir yazılımın açık kaynak olarak nitelendirilebilmesi için dağıtım ve erişim konusunda belirli koşullara uyması gerekir.Bir yapay zeka modelinin gerçekten açık olarak kabul edilebilmesi için OSI’ye göre geliştiricilerin modelin eğitildiği veriler hakkında ayrıntılı bilgi sunması ve insanların bu sistemi herhangi bir amaç için inceleyebilmesine, kullanabilmesine ve değiştirebilmesine imkan tanıması gerekir. Buna karşılık kapalı kaynak, geliştiricinin kontrolünde olan, değiştirilemeyen ve teknik yapısı konusunda daha az şeffaflık sunan yazılım ve modelleri ifade eder.
Herhangi bir önde gelen yapay zeka geliştiricisi açık kaynak yazılım sunuyor mu?
Birçok teknoloji şirketi yapay zeka yazılımlarını açık kaynak olarak tanımlıyor ancak herkes bu tanımın gerçekten karşılandığı konusunda hemfikir değil. Meta Platforms Fransız girişim Mistral ve şimdi de DeepSeek, açık kaynak olarak tanımladıkları yapay zeka modellerini piyasaya sürdü. Ancak bu modellerin çoğu aslında “açık ağırlıklı modeller” olarak biliniyor. Bu modelin ve belki bazı kaynak kodlarının sunulmasının yanı sıra, geliştiricilerin modeli daha iyi özelleştirebilmelerine olanak tanıyan ağırlıkların paylaşılması anlamına geliyor. Ancak genellikle modelin eğitildiği veriler hakkında ayrıntılar sunulmuyor.Örneğin Meta, Llama adlı yapay zeka modelleri serisi için bazı kaynak kodları sunuyor ancak eğitim verileri hakkında ayrıntılı bilgi sağlamıyor. Ayrıca Meta, OSI tarafından daha önce ticari kullanımlara yönelik bazı kısıtlamalar içeren lisanslama koşulları nedeniyle eleştirilmişti. Benzer şekilde DeepSeek, ocak ayında en yeni sistemi olan R1’i açık kaynak model olarak yayımladığını söyledi ancak kod ya da eğitim verisi sunmadı. Bu da şirketin modelini tam olarak neyle inşa ettiği konusunda soru işaretlerine yol açtı. Adında 'açık' ifadesi geçmesine rağmen, OpenAI modellerinin çoğunu açık kaynak yapmıyor. Ancak DeepSeek’in viral başarısının ardından, OpenAI CEO’su Sam Altman, ChatGPT geliştiricisinin “farklı bir açık kaynak stratejisi” geliştirmesi gerektiğini kabul etti. Şöyle ekledi: Bence şahsen burada tarihin yanlış tarafında kaldık.
Ağustos ayında OpenAI, GPT-oss-120b ve GPT-oss-20b adlı, Llama’ya benzer açık ağırlıklı sistemlerden oluşan iki model yayımladı. Bu modeller, yapay zeka yazılım barındırma platformu Hugging Face üzerinden ücretsiz olarak sunuluyor. Modeller, insan akıl yürütmesini taklit edebilir ve kullanıcı komutlarına metin üreterek cevap verebilir ancak görsel ya da video oluşturamazlar.
Açık kaynak sistemlerin faydaları neler?
Açık kaynak yazılımları savunanlar, genellikle bunların kullanıcılar için daha uygun fiyatlı olduğunu çünkü aynı lisans ücretlerine sahip olmadığını öne sürer. Daha ucuz fiyatlar, daha geniş çaplı yapay zeka benimsenmesini mümkün kılar ve azalan geliştirme maliyetleri yeniliği teşvik eder. Destekçiler ayrıca, bu yaklaşımın güçlü yapay zeka sistemleri geliştirenler için hesap verebilirliği artırdığını, çünkü başkalarının modellerin nasıl çalıştığını daha iyi anlamasına imkan tanıdığını belirtir.Kapalı sistemler, yapay zeka pazarının yalnızca birkaç güçlü şirketin egemenliği altına girmesi riskini taşır. Bulut depolama şirketi Box'ın CEO’su Aaron Levie şöyle diyor: Çok pahalı ve özel yapay zeka dünyasında, yapay zeka sağlayıcıları tüm ekonomik getiriyi kendilerine saklamayı seçebilir. Bu da geliştiriciler ve ekosistem için fırsatların ortadan kalkması anlamına gelir.
Meta gibi şirketler için açık kaynak olmanın bir diğer avantajı da popülerlik. Diğer geliştiricilerin açık kaynak yazılımlara erişip üzerine inşa edebilmesine izin vererek, Meta yapay zeka ekosistemi içinde etkisini genişletmeyi başardı.
Açık sistemlerin riskleri neler?
Açık kaynak yazılımı eleştirenler, bu tür yazılımların daha az güvenli olduğunu savunuyor. Yapay zeka bağlamında, ABD’de bazıları Çin gibi rakip ülkelerden gelen modellerin ulusal güvenliği tehdit ettiğini ve vatandaşların güvenliğini riske attığını düşünüyor. Örneğin, büyük miktarda kullanıcı verisi toplayan modeller takip amacıyla kullanılabilir. Ayrıca, Amerikan şirketlerinin farklı derecelerde açıklıkla sunduğu yapay zeka modellerinin, rakip ülkelere bu modelleri kullanarak teknolojik üstünlük sağlama fırsatı sunabileceği yönünde endişeler bulunuyor.DeepSeek neden 'açık' yolu seçti?
Daha açık bir yaklaşımı benimseyerek, DeepSeek muhtemelen Çin’in teknoloji üzerindeki sıkı kontrolüne dair küresel kullanıcılar arasında oluşan bazı endişeleri hafifletti. Girişim ayrıca, diğer geliştiricilerin temel teknolojiyi kendi ihtiyaçlarına göre uyarlamasını kolaylaştırarak, sohbet botunun Batı pazarlarında erişimini de muhtemelen genişletti.Başka bir deyişle, DeepSeek aslında Meta’nın yapay zeka ekosisteminde daha fazla yer kaplamak için izlediği stratejiyi takip etti ve bu durum, Meta CEO’su Mark Zuckerberg’in dikkatinden kaçmamış gibi görünüyor. Zuckerberg, The Joe Rogan Experience programındaki bir röportajda, “Bu büyük bir jeopolitik rekabet ve Çin bu işin üstüne çok ciddi şekilde gidiyor. Eğer herkesin kullanacağı açık kaynak bir model olacaksa, bunun Amerikan modeli olmasını istemeliyiz" ifadelerini kullandı.
DeepSeek’in yapay zeka modeli nasıl çalışıyor?
OpenAI ve Google gibi önde gelen Amerikan geliştiricilerinin bazı yeni modelleri gibi, DeepSeek’in R1 modeli de insanın zaman zaman düşünerek cevap üretme biçimini taklit etmek amacıyla, kullanıcı sorgularına yanıt vermeden önce bir yanıtı hesaplamak için zaman harcıyor. DeepSeek’in, şirketin yakın zamanda piyasaya sürdüğü diğer modeli V3 üzerine inşa edilen versiyonu, verimlilik açısından Amerikan rakiplerinden farklılık gösteriyor.Modelin arkasındaki ekip yenilikçi bir şekilde çalıştı. Rakipler benzer yapay zeka modelleri inşa etmek için büyük miktarda yüksek güçlü bilgisayar çipi kullanırken, DeepSeek ekip üyeleri, ABD'nin en ileri düzey çiplerin ihracatını kısıtlaması nedeniyle erişebildikleri daha az gelişmiş ve sayıca az olan çipleri verimli şekilde kullanmanın yollarını bulmuş görünüyor. Ayrıca, doğru cevaplar için ödül, yanlış cevaplar için ceza veren bir teknik olan pekiştirmeli öğrenme yöntemine büyük ölçüde bel bağladılar. ABD’de bazı teknoloji ve politika liderleri bu gelişmeleri kabul ederken, Çinli şirketin sohbet botunu geliştirirken Batı teknolojisinden faydalanarak büyük dil modelleri geliştirme sürecinin yüksek maliyetlerinden kaçınıp kaçınmadığı sorusunu da gündeme getirdi.