Autor: Iwona Kula
DeepSeek V4 to najważniejsza premiera chińskiego startupu z Hangzhou od czasu modelu R1, który w styczniu 2025 roku wstrząsnął globalnym rynkiem AI. Tym razem reakcja rynków jest spokojniejsza — ale znaczenie techniczne i geopolityczne tego wydania jest trudne do przecenienia.
Model dostępny jest w dwóch wariantach:
V4-Pro — flagowy model o architekturze Mixture-of-Experts z łącznie 1,6 biliona parametrów (49 miliardów aktywowanych jednocześnie). Przeznaczony do zaawansowanych zadań: kodowania, wnioskowania, złożonych agentycznych workflow.
V4-Flash — mniejsza wersja z 284 miliardami parametrów (13 miliardów aktywowanych), zoptymalizowana pod kątem szybkości odpowiedzi i niskich kosztów działania.
Oba modele obsługują kontekst do 1 miliona tokenów i działają w dwóch trybach: myślenia (Thinking) oraz bez myślenia (Non-Thinking). Wagi modeli są dostępne publicznie na platformie Hugging Face — zgodnie z tradycją DeepSeeka stawiającą na otwartość.
Przełom techniczny: architektura i wydajność
Modele V4 wprowadzają kilka istotnych innowacji architektonicznych w stosunku do poprzedników:
Hybrid Attention Architecture łączy dwa mechanizmy uwagi: Compressed Sparse Attention (CSA) oraz Heavily Compressed Attention (HCA). Efekt jest imponujący — w trybie kontekstu miliona tokenów, V4-Pro wymaga jedynie 27% operacji zmiennoprzecinkowych i zaledwie 10% pamięci KV cache w porównaniu do poprzednika, modelu V3.
Manifold-Constrained Hyper-Connections (mHC) to ulepszenie klasycznych połączeń rezydualnych, które poprawia stabilność propagacji sygnału przez kolejne warstwy sieci, zachowując jednocześnie pełną ekspresywność modelu.
Oba modele były trenowane na ponad 32 bilionach różnorodnych i wysokiej jakości tokenów, po których nastąpił rozbudowany proces post-trainingu z wykorzystaniem uczenia przez wzmacnianie.
W benchmarkach kodowania LiveCodeBench V4-Pro osiąga wynik 93,5, a w zawodach Codeforces — 3206 punktów, plasując się wśród najlepszych dostępnych modeli open-source i zbliżając się do czołowych modeli zamkniętych.
Kluczowy przełom: chipy Huawei Ascend 950
To właśnie ten aspekt czyni premierę V4 czymś więcej niż zwykłą aktualizacją modelu.
Poprzednie modele DeepSeeka — V3 i R1 — były trenowane na 2048 procesorach NVIDIA H800 GPU. V4 jest pierwszym modelem tej klasy, który działa na chipach chińskiej produkcji: Huawei Ascend 950 PR.
Jak do tego doszło?
Amerykańskie restrykcje eksportowe od 2022 roku uniemożliwiają chińskim firmom zakup najbardziej zaawansowanych procesorów NVIDIA i AMD. DeepSeek już wcześniej był przedmiotem dochodzeń dotyczących możliwego zakupu chipów NVIDIA przez pośredników w Singapurze. V4 eliminuje ten problem całkowicie — omijając łańcuch dostaw oparty na amerykańskim sprzęcie.
Co istotne, DeepSeek nie udostępnił firmom NVIDIA ani AMD wczesnego dostępu do modelu V4 przed premierą — praktyki standardowej w branży, umożliwiającej optymalizację wsparcia sprzętowego. Wcześniejszy dostęp otrzymały wyłącznie chińskie firmy półprzewodnikowe.
Huawei potwierdziło, że jego platforma Ascend SuperNode, oparta na chipach z serii Ascend 950, w pełni obsługuje modele V4 — zarówno V4-Pro, jak i V4-Flash. Chiński gigant technologiczny opisał swoje rozwiązanie jako technologię „Supernode”, która łączy duże klastry procesorów Ascend 950 w celu zapewnienia mocy obliczeniowej porównywalnej z klastrami NVIDIA.
Możliwości chipsów Ascend 950 PR
Procesor Ascend 950 PR to najnowszy akcelerator AI Huawei, zbudowany na architekturze Da Vinci z pamięcią HBM3. Według analityków rynkowych ze środowisk Weijin Research, Ascend 950 PR plasuje się pod względem możliwości gdzieś pomiędzy NVIDIA H100 a H200. Co ważne, jest to jak dotąd jedyny chiński procesor AI obsługujący bardziej zwarty format liczbowy dla obliczeń AI (FP8/BF16), co pozwala wykonywać więcej operacji w jednostce czasu i obniża koszt obsługi zapytań.
Przepisanie od podstaw stosu programowego
Jak donosi MIT Technology Review, kilkumiesięczne opóźnienie premiery V4 wynikało właśnie z konieczności gruntownego przepisania stosu programowego DeepSeeka — kompilatorów, operatorów, bibliotek komunikacyjnych, frameworków do treningu rozproszonego i inferencji — aby wycisnąć maksymalną wydajność z innej architektury chipów Huawei.
Eksperci zaznaczają jednak, że podział między sprzętem NVIDIA a Huawei podczas treningu V4 pozostaje nieznany. Możliwe, że jest to migracja częściowa, a nie całkowite zerwanie z ekosystemem NVIDIA. Chipy Huawei są w tej chwili lepiej przystosowane do inferencji niż do trenowania modeli — kolejna generacja, Ascend 950 DT, projektowana z myślą o głębokim uczeniu i treningu, ma trafić na rynek do końca 2026 roku.
Rynek reaguje: zamówienia na Ascend 950 eksplodują
Premiera V4 wywołała prawdziwą gorączkę zakupową na chiński sprzęt. Przed ogłoszeniem modelu największe chińskie firmy technologiczne — Alibaba, ByteDance i Tencent — złożyły zamówienia na setki tysięcy chipów Ascend 950. Popyt okazał się tak duży, że ceny procesorów Huawei wzrosły o około 20%.
Alibaba Cloud wdrożyło V4 na swojej platformie Bailian w tym samym dniu co premiera, oferując oba warianty — V4-Pro i V4-Flash — po cenach DeepSeeka. Rynek reaguje błyskawicznie na perspektywę AI infrastruktury niezależnej od Ameryki.
DeepSeek zapowiedział, że ceny V4-Pro mogą znacząco spaść, gdy Huawei zwiększy skalę produkcji chipów Ascend 950 w drugiej połowie 2026 roku.
Ceny: nadal wielokrotnie niższe niż OpenAI
Jedną z cech charakterystycznych DeepSeeka od początku jego istnienia jest agresywna polityka cenowa. V4 nie jest wyjątkiem:
ModelCena za 1M tokenów wejściowychCena za 1M tokenów wyjściowychDeepSeek V4-Pro (pełna cena) $1,74 $3,48 DeepSeek V4-Flashznacznie niższa $0,28 GPT-5.5 (OpenAI) $5,00 $30,00
Dla porównania: OpenAI pobiera za wyjście tokenów blisko dziesięciokrotnie więcej niż DeepSeek za swój flagowy model. Nawet po wygaśnięciu promocji (75% zniżki obowiązującej do 5 maja 2026 roku) V4 pozostaje daleko tańszą alternatywą.
Geopolityczny wymiar premiery
Premiera V4 zbiegła się w czasie z poważnymi oskarżeniami ze strony USA. Tego samego dnia, gdy DeepSeek opublikował nowy model, Reuters poinformował, że Departament Stanu USA rozesłał do ambasad na całym świecie depeszę instruującą personel, by ostrzegał zagraniczne rządy przed rzekomą kradzieżą własności intelektualnej przez DeepSeeka i inne chińskie firmy AI. Biały Dom wcześniej opublikował memorandum oskarżające chińskie podmioty o „celowe, przemysłowe kampanie destylacji” amerykańskich modeli frontier.
Jednak to właśnie aspekt sprzętowy V4 jest strategicznie najważniejszy. Jak analizuje Council on Foreign Relations: model frontier działający konkurencyjnie na krajowym sprzęcie podważa jedno z kluczowych założeń amerykańskiej polityki eksportowej — przekonanie, że odcięcie dostępu do chipów spowolni rozwój chińskiej AI.
Rząd chiński od dawna naciskał na DeepSeeka, by integrował krajowe chipy w swoich procesach. Jest to element szerszego wzorca chińskiej polityki przemysłowej: strategiczne sektory są skłaniane — a czasem de facto zobowiązywane — do realizacji celów narodowej samowystarczalności technologicznej.
Jeśli DeepSeek w ciągu najbliższych lat zdoła prowadzić pełny cykl treningu i inferencji na chipach Ascend i ustabilizuje kompletny stos programowy, jego pipeline produkcji modeli może stać się faktycznie niezależny od ekosystemu CUDA firmy NVIDIA.
Gdzie V4 stoi względem konkurencji?
Warto zachować trzeźwość oceny. Jak przyznaje sam DeepSeek w swoim raporcie technicznym, V4 ustępuje modelom frontier o około 3–6 miesięcy. Jego możliwości wnioskowania i agentyczne są porównywalne z GPT-5.2, Gemini 3.0 Pro i Claude Opus 4.5 — modelami wydanymi mniej więcej pół roku temu.
Oznacza to, że V4 jest zdecydowanie najlepszym dostępnym modelem open-source, ale nie redukuje jeszcze luki z czołówką modeli zamkniętych. Analitycy oceniają, że USA utrzymują przewagę około siedmiu miesięcy nad Chinami w wyścigu AI.
Podsumowanie: nie rewolucja, lecz sygnał
DeepSeek V4 nie wstrząśnie rynkami tak jak R1 rok temu. Ale jego znaczenie jest głębsze i bardziej strukturalne.
Po raz pierwszy w historii widzimy model klasy frontier zdolny do działania na sprzęcie w pełni niezależnym od amerykańskich chipów. Chiny budują równoległy ekosystem AI — od sprzętu, przez oprogramowanie, po modele — i V4 jest pierwszym namacalnym dowodem, że ta strategia przynosi rezultaty.
Dla deweloperów i firm oznacza to tańszy dostęp do zaawansowanych możliwości AI na własnych warunkach. Dla geopolityki AI — sygnał, że era monopolu NVIDIA na infrastrukturę AI może zbliżać się ku końcowi, przynajmniej na rynku chińskim.
Pytanie nie brzmi już, czy Chiny mogą zbudować frontier AI bez NVIDIA. Pytanie brzmi: jak szybko staną się w tym naprawdę dobre.
Źródła: CNN Business, MIT Technology Review, Council on Foreign Relations, Tom’s Hardware, TrendForce, Reuters, DeepSeek API Docs, Hugging Face.
Autor: Tomasz Szepelak
Ekspert z wieloletnim doświadczeniem w branży IT, posiadający obszerną wiedzę techniczną obejmującą Cyberbezpieczeństwo w środowiskach Windows i Linux, znajdowanie podatności na stronach internetowych oraz udzielanie zaleceń dotyczących zamykania znalezionych podatności. Jest odpowiedzialny za wsparcie użytkowników końcowych, instalację, wdrożenie i utrzymanie różnych komponentów LAN/WAN w środowisku korporacyjnym w strukturach firmy międzynarodowej. Uczestniczy w różnorodnych projektach, jako niezależny lider projektu, pracuje nad wdrożeniami nowych rozwiązań. Może pochwalić się również szeroką wiedzą w zakresie procesów IT i tytułem ITIL® Expert.