DeepSeek, Silikon Vadisi'ni korkutan güçlü Çin yapay zekasıdır. Ancak Pekin'in sansürü endişe verici

Suzan · 27 Ocak 2025

Amerika'da şu anda iPhone'larda en çok indirilen ücretsiz uygulama Çince. denir Derin Arama ve tabanlı bir sohbet robotudur güçlü üretken yapay zeka modeli.

Birkaç gün içinde bu yapay zeka dönüştü Amerikan büyük teknolojisinin en kötü kabusu.

Uzun süredir teknoloji şirketlerinin hakimiyetinde olan yapay zekanın acımasız işinde Silikon VadisiDeepSeek, güçlü, verimli ve uygun maliyetli modellerle kendisini hızla yeni bir yıkıcı güç olarak kabul ettirdi.

Bu yapay zeka yalnızca açık kaynak ve ücretsiz – burada deneyebilirsiniz – ancak aynı zamanda geliştiricilere, sektördeki en etkili şirketlerin bazılarının yarattığı şirketlerden çok daha az maliyetlidir. OpenAI, Antropik ve Google.

Sosyal medyada “Deepseek şimdiye kadar gördüğüm en şaşırtıcı ve etkileyici yeniliklerden biri ve açık kaynak olarak dünyaya harika bir hediye” diye yazdı. Marc Andreessenİlk başarılı web tarayıcılarından biri olan Netscape'in kurucularından biri olarak biliniyor ve Andreessen HorowitzSilikon Vadisi'nin önde gelen risk sermayesi şirketlerinden biri.

Deepseek R1 şimdiye kadar gördüğüm en şaşırtıcı ve etkileyici buluşlardan biri ve açık kaynak olarak dünyaya büyük bir hediye.

— Marc Andreessen (@pmarca) 24 Ocak 2025

Ancak gerçekte DeepSeek şunu temsil eder: ABD'nin yapay zeka üstünlüğüne yönelik bir tehditson yıllarda ağır yaptırımlarla Çinli şirketlerin teknolojik gelişimini yavaşlatmaya çalışan kişiler.

DeepSeek Nedir?

DeepSeek ilk olarak geçtiğimiz Aralık ayında 671 milyar parametreye sahip ve yaklaşık 55 günde eğitilen V3 modelini tanıttığında fark edilmişti.

Bu model Meta'yı geride bırakıyor Lama 3.1başka bir güçlü açık kaynaklı yapay zeka ve karşılaştırılabilir bir performansa ulaşıyor OpenAI'den Gpt-4o ve Claude 3.5 Sonnet tarafından Antropik.

Ancak asıl deprem yalnızca birkaç gün önce, 20 Ocak'ta DeepSeek'in bunu ortaya çıkarmasıyla gerçekleşti. R1odaklı bir yapay zeka modeli ileri muhakeme becerileri.

Takviyeli öğrenme teknikleriyle geliştirilen R1, OpenAI'nin aşağıdaki gibi amiral gemisi modelleriyle karşılaştırılabilir bir performans gösterdi: o1 ve o1-miniözellikle matematik ve programlama alanlarında.

Yeni DeepSeek modeli hemen göze çarpıyordu Chatbot Arenasıbüyük dil modellerini, bunları kullanan insanların tercihlerine dayalı olarak anonim, rastgele karşılaştırmalar yoluyla değerlendiren bir platform: DeepSeek R1, OpenAI'nin o1 ve o1-mini modellerinden daha iyi performans gösteriyor ve Google'ın en iyi modellerine rakip oluyor – örneğin Gemini 2.0 Flash Düşüncesi – bu özel sıralamaya hakim olan.

Akıl yürütmede yeni bir sınır

DeepSeek'in R1 modeli, dünyada özellikleri bir araya getiren ilk modellerden biridir. gerçek zamanlı web araması ve gelişmiş muhakeme becerileri, örneğin OpenAI'nin o1 modelinde bulunmayan bir özellik.

Önceden var olan verilere dayanan o1'den farklı olarak, R1 aslında web'den güncellenmiş bilgiler.

Ayrıca R1, kullanıcıya cevaplarına ulaşmak için attığı adımları anlatarak “akıl yürütmesini” açıklıyor. Bu şeffaflık, kullanıcılara karar verme süreci hakkında bilgi sağlar. Bir tür “bilinç akışına” tanık oluyor gibi görünüyor, ancak DeepSeek R1'in – diğer tüm büyük dil modelleri gibi – ürettiği şeyi anlama konusunda gerçek bir yeteneğe sahip olmadığının altını çizmek önemlidir.

Açık kaynak, gizlilik ve maliyet verimliliği

DeepSeek'in temel özelliklerinden biri doğasıdır. açık kaynak: Bu yapay zekanın kodu açıktır ve modelin tamamı herkes tarafından incelenebilir, değiştirilebilir ve geliştirilebilir.

Ayrıca DeepSeek modelleri garanti verecek şekilde tasarlanmıştır. çıkarımlar – yapay zekanın yeni verileri yorumlama ve düşük maliyetle yanıtlar sağlama yeteneği.

Örneğin DeepSeek R1 ile bir milyon jetonu işleyin Fiyatı yaklaşık 2,19 dolarOpenAI'nin o1 modeliyle aynı işlemin fiyatı ise 60 dolar.

DeepSeek'in R1'i mükemmel çalışıyor gibi görünüyor yerel olarak bile modelin optimize edilmiş versiyonları sayesinde kişisel bilgisayarlarda ve akıllı telefonlarda 1,5 ila 70 milyar parametreKullanıcıların donanım yeteneklerine uyarlanabilir.

Bu, özellikle modeli cihazlarına indirmeye karar verenler için önemli bir avantajdır. mahremiyet.

Bu tür gelişmiş modellere çevrimdışı erişim, yalnızca sürekli bir internet bağlantısı gerekmediği için yapay zekanın kullanımını demokratikleştirmekle kalmıyor, aynı zamanda bu teknolojiyi kullananların verilerinizi akıllı telefonunuzda veya PC'nizde saklayınbunları genellikle yapay zekanın gerçekleştirdiği karmaşık işlemler için yeterli bilgi işlem gücü sunan merkezi sunuculara göndermeye gerek kalmadan.

Düşük maliyetli eğitim

DeepSeek, V3 modelini eğittiğini iddia ediyor yaklaşık 5,58 milyon dolarlık yatırım. ABD'nin büyük teknoloji şirketlerinin beyan ettiği maliyetle karşılaştırıldığında ihmal edilebilir bir maliyet.

Dario AmodeiAnthropic CEO'su, yapay zeka modellerini eğitmenin şu anda yaklaşık maliyeti olduğunu söyledi 100 milyon dolargeliştirilmekte olan bazı projelerle birlikte 1 milyara kadar.

Amodei'nin tahminlerine göre 2025 veya 2026'ya kadar bu maliyetler 10 milyar dolara, daha sonra da potansiyel olarak 100 milyara çıkabilir.

Rekabete göre stratejik avantajlar

Birçok yapay zeka şirketi ağırlıklı olarak gelişmiş donanımlara güvenirken DeepSeek, optimizasyonu maksimuma çıkarmaya odaklandı yazılım cephesindeki kaynaklar.

Amerika Birleşik Devletleri'nin Çin'in en gelişmiş yarı iletkenlere erişimini sınırlayan ihracat kısıtlamaları nedeniyle DeepSeek, bu duruma uyum sağlamak zorunda kaldı. Daha az verimli Nvidia çiplerigibiH800bu sınırlamalara uyacak şekilde tasarlanmıştır.

Bu kısıtlamalara rağmen şirket, yazılım yoluyla kaynak optimizasyonunu mükemmelleştirdi. OpenAI ve Google gibi şirketler tarafından geliştirilen Batı modellerine göre önemli ölçüde daha düşük maliyetlerle kayda değer performans elde edilmesini sağlayan yenilikçi bir yaklaşım.

Yapay zeka

Çünkü Çin yapay zekasının piyasaya sürülmesi Nvidia'nın değerinin %10'unu kaybetmesine neden oldu

kaydeden Arcangelo Rociola

27 Ocak 2025

DeepSeek'in arkasında kim var?

2023 yılında girişimci tarafından kuruldu Liang WenfengDeepSeek, Hangzhou merkezli bir niceliksel hedge fonu olan High-Flyer'dan geliyor. Yapay zeka tabanlı ticaret stratejileri.

Böyle bir yatırım fonu, alım satım kararları vermek için insan yargısına güvenmek yerine niceliksel analiz, istatistiksel modeller ve algoritmalar kullanır.

2015 yılında kurulan High-Flyer, Çin'de kısa sürede adını duyurdu ve 100 milyar RMB'den (yaklaşık 15 milyar $) fazla para toplayan ilk niceliksel hedge fonu oldu.

Yıllardır Yüksek Uçan GPU biriktirdi ve finansal verileri analiz etmek için Fire-Flyer süper bilgisayarlarını geliştirdi.

Wenfeng'in vizyonu: finanstan yapay zeka hakimiyetine

Ancak Wenfeng'in vizyonu finansın ötesine geçti ve birçok sektörde yapay zekanın potansiyelinden yararlanmayı hedefliyordu.

Zhejiang Üniversitesi'nden elektronik bilgi mühendisliği mezunu (bilgi ve iletişim mühendisliği alanında yüksek lisans derecesine sahip) Wenfeng, 2023 yılında High-Flyer fonundaki kaynakları avangard yapay zeka modelleri oluşturmak için DeepSeek adlı yeni bir girişime yönlendirdi.

“Ticari bir sebep bulamadım [per la fondazione di DeepSeek]bana sorsanız bile olmaz” – Wenfeng Çin teknoloji dergisi 36Kr'a şöyle açıkladı: çünkü ticari olarak uygun değil. Temel araştırmanın yatırım getirisi çok düşük. OpenAI'nin ilk yatırımcıları sermaye sağladıklarında kesinlikle bunun ne kadar olacağını düşünmüyorlardı. kazanacaklardı ama bunun yerine bu projeyi gerçekten inşa etmek istiyorlardı.”

Bugün DeepSeek, Çin'deki teknoloji devlerinin finansmanına bağımlı olmayan birkaç büyük yapay zeka şirketinden biridir. Baidu, Alibaba veya ByteDance.

Çin hükümeti politikalarıyla uyum

DeepSeek kullanıcılarının gerçekleştirdiği ilk görüşmelerden itibaren modellerinin uyumu ortaya çıkıyor Çin hükümetinin politikalarıözellikle içerik denetimiyle ilgili.

Bu yazarınkiler de dahil olmak üzere çeşitli testler, protestolar gibi politik açıdan hassas konularda sorgulandığında şunu göstermiştir: Tiananmen Meydanı 1989 yılı Hong Kong'da demokrasi yanlısı hareketlerDeepSeek genellikle doğrudan yanıtlardan kaçınır veya resmi hükümet açıklamalarını yansıtan versiyonlar sunar.

Bu davranış, uyumluluğu sağlamak için yapay zekaya entegre sansür mekanizmalarının benimsenmesini önerir. Çin Komünist Partisinin yönergeleri.

Bu uyum, teknolojik yenilik ve teknoloji arasındaki hassas denge hakkında soruları gündeme getiriyor. bilgi edinme özgürlüğüözellikle DeepSeek modellerine dünyanın her yerinden açık ve ücretsiz olarak erişilebildiği bir dönemde.

@ppisa

DeepSeek, Silikon Vadisi'ni korkutan güçlü Çin yapay zekasıdır. Ancak Pekin'in sansürü endişe verici

Suzan

New member