Çinli yapay zeka laboratuvarı DeepSeek’in kendi adını taşıyan büyük dil modeli (LLM), ABD'li OpenAI firmasının ChatGPT'sinin en büyük rakiplerinden biri haline gelirken, Pazartesi günü küresel teknoloji hisselerini de sarstı.
Nvidia, çiplerinin yapay zeka teknolojisinin belkemiği olarak görülmesiyle yapay zeka hisse senetlerinde bir patlamaya öncülük etmişti. Kaliforniya merkezli çip firmasının hisseleri pazartesi piyasa öncesi işlemlerde yüzde 10 düştü.
Çinli yapay zeka laboratuvarı DeepSeek’in kendi adını taşıyan büyük dil modeli (LLM), ABD'li OpenAI firmasının ChatGPT'sinin en büyük rakiplerinden biri haline gelirken, Pazartesi günü küresel teknoloji hisselerini de sarstı.
Önceki hafta yayınlanan yayınlanan DeepSeek-R1 adlı büyük dil modelinin (LLM), daha az çip ve maliyetle ChatGPT'nin son modellerinden biri olan o1 seviyesinde performans göstermesi, yapay zeka çipleriyle ünlü Nvidia'nın değer kaybetmesine neden oldu.
ChatGPT'nin eğitim verilerini işlemek için 10.000 Nvidia grafik işlem birimine (GPU) ihtiyaç duyduğu düşünülüyor. DeepSeek mühendisleri sadece 2.000 GPU ile benzer sonuçlara ulaştıklarını söylüyor.
Nvidia, çiplerinin yapay zeka teknolojisinin belkemiği olarak görülmesiyle yapay zeka hisse senetlerinde bir patlamaya öncülük etmişti. Kaliforniya merkezli çip firmasının hisseleri pazartesi piyasa öncesi işlemlerde yüzde 10 düştü.
Nasdaq 100 vadeli işlemleri yüzde 3,4, S&P 500 ise New York'ta sabah 5.00 itibarıyla yüzde 2 düşüş gördü. Avrupa'da teknoloji hisselerinde de benzer bir tablo görüldü. Hollandalı çip ekipmanı üreticisi ASML Holding NV'nin hisseleri yüzde 11 değer kaybetti.
Bloomberg'e göre, Nasdaq 100 ve Avrupa'nın Stoxx 600 teknoloji alt endeksi, kayıplar devam ederse toplamda yaklaşık 1 trilyon dolarlık bir piyasa değeri kaybına uğramış olacak.
App Store'da bir numaraya çıktı
Bu arada DeepSeek'in mobil uygulaması da pazartesi günü ChatGPT'yi geride bırakarak ABD'de Apple App Store'daki en yüksek puanlı ücretsiz uygulama oldu.Öte yandan Reuters'a göre söz konusu uygulama, girişimin bir önceki modeli olan DeepSeek-V3'le çalışıyor.
Veri araştırma şirketi Sensor Tower, 10 Ocak'ta piyasaya sürülen modelin ABD kullanıcıları arasında popülerlik kazandığını belirtiyor.
Son yayınlanan model olan DeepSeek R1 ise araştırmacılar tarafından özellikle matematik ve kodlamada karmaşık muhakeme görevlerini yerine getirme becerisiyle övülüyor. Model, ChatGPT o1 tarafından kullanılana benzer bir "düşünce zinciri" yaklaşımı kullanıyor ve bu da sorguları adım adım işleyerek sorunları çözmesine olanak tanıyor.
Açık kaynaklı bir model
Üstelik DeepSeek-R1 büyük ölçüde açık kaynaklı olarak yayınlandı. Yani isteyen herkes aracın kodlarına erişebiliyor ve bu kodları kullanarak LLM'i kişiselleştirebiliyor. Eğitim verileri ise patentli.
Öte yandan OpenAI, o1 modelini kapalı olarak piyasaya sürmüştü ve halihazırda sadece kullanıcılara bile aylık 20 ila 200 dolarlık paketlerle satıyor.
MIT Technology Review'a konuşan DeepSeek çalışanı ve Northwestern Üniversitesi'nde bilgisayar bilimi alanında doktora öğrencisi Zihan Wang, Çin'in yaptırımlara karşı yenilikçi yollara başvurmak zorunda kaldığını söylüyor.
Buna göre DeepSeek, R1 modelini oluşturmak için eğitim sürecini yeniden düzenlemek zorunda kaldı. Çünkü çip firması Nvidia'nın Çin pazarı için satmaya izinli olduğu çiplerin performansı, şirketin en iyi ürünlerinin hızının yarısı kadar ediyor. Bu yüzden Çin, Nvidia'dan satın aldığı grafik işlem birimleri (GPU) üzerindeki yükü azaltmak için eğitim sürecini düzenledi.
Kaynak: Euro News