“Deepseek R1, özellikle maliyetini dikkate alırsanız, olağanüstü bir modeldir.“.
Sam AltmanOpenai'nin CEO'su, üretken yapay zeka devrimini başlatan 180 milyar dolarlık şirket halka açık Chatgpt Kasım 2022'de, Çin yardımının başarısı sportiflik ile karşılaşmış gibi görünüyor.
R1 modeli Silikon Vadisi'ni şaşırttı Ve dünyanın geri kalanı, gelişmiş ve sofistike bir akıl yürütme kapasitesi gösteriyor. Bunu daha da olağanüstü yapan şey eğitiminin ihmal edilebilir maliyeti – Sadece 6 milyon dolar, büyük teknoloji tarafından şimdiye kadar harcanan 100 milyondan çok daha düşük bir rakam ve kullanılan donanım.
Deepseek eğitim için kullandığını iddia ediyor R1 sadece Nvidia H800 – Amerika Birleşik Devletleri'nin Çin şirketlerine getirdiği teknolojik kısıtlamalara saygı göstermek için sınırlı performans yongaları – e Nvidia A100 eski nesil.
Bu GPU'lar H100 gibi en gelişmiş modellere kıyasla daha düşük performans sunsa da, Deepseek verimli eğitim teknikleri aracılığıyla becerilerinden en iyi şekilde yararlandı. Çinliler söz konusu olduğunda, kısacası, fark donanımı değil yazılımı yaptı. Sonuç olarak, Nvidia eylemleri çöktü.
Zeka Dizileme
Çünkü birinin Çinlilere lansmanı değerinin% 10'unu Nvidia'ya kaybetti
Arcangelo Rociola tarafından
27 Ocak 2025
Nvidia'nın güveni
Ancak son servetini yapay zeka için belirli işlemcilere inşa eden şirket, Borsada% 500 büyümüş Chatgpt başlatıldığından beri, Çin ilerlemesi karşısında güvenlik ile gösterişti.
“Deepseek, yapay zeka bağlamında mükemmel ilerlemeyi temsil ediyor ve zaman ölçeklendirme testinin mükemmel bir örneğidir” dedi. NvidiaModelin kendisini değiştirmek veya yeniden kazanmaya gerek kalmadan, kullanıldığı an (So -Time Test Testi) için bir modelin performansını artırmanıza izin veren yapay zeka alanında ortaya çıkan bir tekniğe atıfta bulunur.
Yeni AI eğitim teknikleri
“Deepseek'in çalışmaları, bu tekniği kullanarak yeni modeller oluşturmanın nasıl mümkün olduğunu gösteriyor – sözcüsü ekledi – büyük ölçüde mevcut modellerden ve hesaplama kaynaklarından yararlanarak ihracat kontrolü düzenlemelerine tamamen uyuyor”.
NVIDIA'nın ifadeleri bu nedenle Deepseek'ten elde edilen sonuçların gerçekte Amerikan şirketi tarafından üretilen grafik işleme birimlerine (GPU) olan talebi artıracağını düşündürmektedir.
“Çıkarım önemli sayıda NVIDIA GPU ve yüksek performanslı bir ağ gerektirir – şirketin sözcüsü ekledi. Jensen Huang -Now üç ölçeklenebilirlik yasamız var: ilgili olmaya devam eden eğitim öncesi ve gün sonrası eğitim ve yeni ölçeklendirme testi “.
Sam Altman ayrıca “daha büyük bir hesaplama gücünün” “bugün her zamankinden daha fazla” gerekli olduğuna ikna oldu Yaşlanmaya ulaşmak içinyani insan zekasının eşit veya üstesinden gelebilen genel yapay zeka.
Deepseek, Silikon Vadisi'ni korkutan güçlü Çin IA'dır. Ama Pekin sansüründen endişelen
Pier Luigi Pisa tarafından
27 Ocak 2025
Deepseek tarafından ilan edilen donanımla ilgili şüpheler
Bununla birlikte, bazı uzmanlar, yapay zeka modellerini eğitmek için kullanılan donanımda Deepseek tarafından paylaşılan bilgileri sorguladı.
Şüpheciler arasında Alexandr Wangmilyarder CEO'su ÖlçeklerYapay zeka için veri yönetimi ve otomasyon çözümleri sağlayan bir Silikon Vadisi şirketi.
Wang'a göre, Deepseek ve diğer Çinli atölyeler, AI pazarında hala Avant -Garde olarak kabul edilen büyük miktarda Nvidia cipsi elde etmeyi başardılar, yani H100.
“Bildiklerimden, Deepseek'in yaklaşık 50.000 H100'ü var – Wang CNBC – Açıkçası bu konuda konuşamasalar da, çünkü bu ABD'nin getirdiği ihracatla ilgili kontrol düzenlemelerini ihlal edecektir “.
Elon MuskTesla ve SpaceX'in CEO'su ve GroK'ın yapay zekasını geliştiren Xai şirketinin sahibi, X kullanıcıları tarafından kullanılan chatbot, Wang'ın sosyal ağlarına yorum yaptı.
“Bu açık,” diye yazdı Musk, kısaca, Deepseek'in en son R1 modelini eğitmek için kullanılan donanım hakkındaki tüm gerçeği söylememe olasılığını kabul ettiğini söyledi.
Sam AltmanOpenai'nin CEO'su, üretken yapay zeka devrimini başlatan 180 milyar dolarlık şirket halka açık Chatgpt Kasım 2022'de, Çin yardımının başarısı sportiflik ile karşılaşmış gibi görünüyor.
Düşük maliyetli bir devrimsel modelDeepseek'in R1'i etkileyici bir model, partikül -fiyat için ne sunabildikleri şey.
Açıkçası çok daha iyi modeller sunacağız ve ayrıca yeni bir yarışmacıya sahip olmak yasaldır! Bazı sürümleri çekeceğiz.
– Sam Altman (@sama) Janogy 28, 2025
R1 modeli Silikon Vadisi'ni şaşırttı Ve dünyanın geri kalanı, gelişmiş ve sofistike bir akıl yürütme kapasitesi gösteriyor. Bunu daha da olağanüstü yapan şey eğitiminin ihmal edilebilir maliyeti – Sadece 6 milyon dolar, büyük teknoloji tarafından şimdiye kadar harcanan 100 milyondan çok daha düşük bir rakam ve kullanılan donanım.
Deepseek eğitim için kullandığını iddia ediyor R1 sadece Nvidia H800 – Amerika Birleşik Devletleri'nin Çin şirketlerine getirdiği teknolojik kısıtlamalara saygı göstermek için sınırlı performans yongaları – e Nvidia A100 eski nesil.
Bu GPU'lar H100 gibi en gelişmiş modellere kıyasla daha düşük performans sunsa da, Deepseek verimli eğitim teknikleri aracılığıyla becerilerinden en iyi şekilde yararlandı. Çinliler söz konusu olduğunda, kısacası, fark donanımı değil yazılımı yaptı. Sonuç olarak, Nvidia eylemleri çöktü.
Zeka Dizileme
Çünkü birinin Çinlilere lansmanı değerinin% 10'unu Nvidia'ya kaybetti
Arcangelo Rociola tarafından
27 Ocak 2025

Nvidia'nın güveni
Ancak son servetini yapay zeka için belirli işlemcilere inşa eden şirket, Borsada% 500 büyümüş Chatgpt başlatıldığından beri, Çin ilerlemesi karşısında güvenlik ile gösterişti.
“Deepseek, yapay zeka bağlamında mükemmel ilerlemeyi temsil ediyor ve zaman ölçeklendirme testinin mükemmel bir örneğidir” dedi. NvidiaModelin kendisini değiştirmek veya yeniden kazanmaya gerek kalmadan, kullanıldığı an (So -Time Test Testi) için bir modelin performansını artırmanıza izin veren yapay zeka alanında ortaya çıkan bir tekniğe atıfta bulunur.
Yeni AI eğitim teknikleri
“Deepseek'in çalışmaları, bu tekniği kullanarak yeni modeller oluşturmanın nasıl mümkün olduğunu gösteriyor – sözcüsü ekledi – büyük ölçüde mevcut modellerden ve hesaplama kaynaklarından yararlanarak ihracat kontrolü düzenlemelerine tamamen uyuyor”.
NVIDIA'nın ifadeleri bu nedenle Deepseek'ten elde edilen sonuçların gerçekte Amerikan şirketi tarafından üretilen grafik işleme birimlerine (GPU) olan talebi artıracağını düşündürmektedir.
“Çıkarım önemli sayıda NVIDIA GPU ve yüksek performanslı bir ağ gerektirir – şirketin sözcüsü ekledi. Jensen Huang -Now üç ölçeklenebilirlik yasamız var: ilgili olmaya devam eden eğitim öncesi ve gün sonrası eğitim ve yeni ölçeklendirme testi “.
Sam Altman ayrıca “daha büyük bir hesaplama gücünün” “bugün her zamankinden daha fazla” gerekli olduğuna ikna oldu Yaşlanmaya ulaşmak içinyani insan zekasının eşit veya üstesinden gelebilen genel yapay zeka.
Deepseek, Silikon Vadisi'ni korkutan güçlü Çin IA'dır. Ama Pekin sansüründen endişelen
Pier Luigi Pisa tarafından
27 Ocak 2025


Deepseek tarafından ilan edilen donanımla ilgili şüpheler
Bununla birlikte, bazı uzmanlar, yapay zeka modellerini eğitmek için kullanılan donanımda Deepseek tarafından paylaşılan bilgileri sorguladı.
Şüpheciler arasında Alexandr Wangmilyarder CEO'su ÖlçeklerYapay zeka için veri yönetimi ve otomasyon çözümleri sağlayan bir Silikon Vadisi şirketi.
Wang'a göre, Deepseek ve diğer Çinli atölyeler, AI pazarında hala Avant -Garde olarak kabul edilen büyük miktarda Nvidia cipsi elde etmeyi başardılar, yani H100.
“Bildiklerimden, Deepseek'in yaklaşık 50.000 H100'ü var – Wang CNBC – Açıkçası bu konuda konuşamasalar da, çünkü bu ABD'nin getirdiği ihracatla ilgili kontrol düzenlemelerini ihlal edecektir “.
Elon MuskTesla ve SpaceX'in CEO'su ve GroK'ın yapay zekasını geliştiren Xai şirketinin sahibi, X kullanıcıları tarafından kullanılan chatbot, Wang'ın sosyal ağlarına yorum yaptı.
“Bu açık,” diye yazdı Musk, kısaca, Deepseek'in en son R1 modelini eğitmek için kullanılan donanım hakkındaki tüm gerçeği söylememe olasılığını kabul ettiğini söyledi.