W 2023 roku rynek akceleratorów AI wyceniano na 55 miliardów dolarów. Dziś te dane wyglądają jak odległa przeszłość. Branża przebiła pułap 200 miliardów, a środek ciężkości niebezpiecznie przesuwa się z prostego trenowania modeli w stronę ciągłego wnioskowania (inference). To zupełnie inna gra – tutaj liczy się nie tylko surowa moc, ale przede wszystkim przepustowość pamięci i rachunki za energię, które potrafią położyć na łopatki każdy budżet.

Nvidia przez lata przyzwyczaiła nas do roli niepodzielnego władcy. W 2024 roku przejęła 87% rynku, opierając swoją potęgę na ekosystemie CUDA, w którym deweloperzy zasiedzieli się na dobre. Czy jednak to imperium jest tak stabilne, jak sugerują wykresy na Wall Street? Historia uczy, że żaden monopol nie przetrwa starcia z interesami największych chmur obliczeniowych świata, które mają zbyt wiele do stracenia, by bezczynnie patrzeć na dyktat cenowy jednego dostawcy.

Nvidia: Imperium pod presją własnego sukcesu

Przychody Nvidii z segmentu Data Center są wręcz obłędne – szacunki na rok fiskalny 2026 wskazują na 193,7 miliarda dolarów. Jednak nawet przy takim wzroście, firma musi pogodzić się z erozją udziałów. Z rekordowych 87% w 2024 roku, Nvidia zmierza w okolice 75% pod koniec 2026 roku. To nie jest słabość, lecz matematyczna konieczność: rynek rozrasta się tak gwałtownie, że jeden gracz fizycznie nie jest w stanie dostarczyć wystarczającej liczby chipów. Nvidia wciąż dominuje przy treningu modeli, ale w obszarze inferencji pole staje się coraz bardziej zatłoczone.

Podmiot Udział 2024 Prognoza 2026
Nvidia ~87% ~75%
AMD ~5% ~7–10%
Broadcom (ASIC) ~7–10% ~12–15%
Google TPU ~5–7% ~6–8%

Tabela 1: Ewolucja udziałów w przychodach na rynku akceleratorów AI.

AMD: Najpoważniejszy pretendent do tronu

AMD przestało być tylko „tanią alternatywą”. Ich strategia oparta na modelu MI355X, wyprodukowanym w litografii 3nm, to klasyczny przykład uderzenia w słaby punkt konkurencji. Zamiast ścigać się na teoretyczne TFLOPS-y, AMD postawiło na 288 GB pamięci HBM3E i przepustowość 8,0 TB/s. W praktyce, przy modelach typu Mixture of Experts (MoE), trzy układy AMD wykonają zadanie, do którego Nvidia potrzebuje aż pięciu jednostek B200. Dla dużych graczy chmurowych, którzy tną koszty operacyjne, różnica w cenie rzędu 30-40% na pojedynczy token jest argumentem, którego nie da się zignorować.

PRO TIP: Dzięki ewolucji stosu ROCm 7.0 i wsparciu dla OpenAI Triton czy PyTorch 2.0, bariera „vendor lock-in” CUDA zaczyna pękać. Programiści wreszcie mogą przenosić obciążenia bez konieczności przepisywania całego kodu.

Intel: Trudne lekcje i plan na przyszłość

Historia modelu Gaudi 3 to przestroga dla każdego producenta sprzętu. Mimo obiecujących parametrów technicznych i otwartych standardów komunikacji, Intel poległ na oprogramowaniu. Problemy ze stabilnością i integracją z jądrem Linuxa sprawiły, że rynek enterprise potraktował ten sprzęt z rezerwą, co zmusiło zarząd do radykalnej rewizji celów sprzedażowych. Obecna strategia Intela, czyli platforma Jaguar Shores, to gra na długi dystans, celująca w 2027 rok. Na ten moment Intel w segmencie akceleratorów AI to margines, który musi udowodnić swoją przydatność od zera.

ASIC: Ciche zagrożenie płynące z własnych serwerowni

Najwięksi klienci – Google, Meta czy Amazon – doszli do wniosku, że płacenie gigantycznych marży Nvidii nie ma sensu ekonomicznego. Zamiast kupować gotowe GPU, projektują własne układy ASIC. Google ze swoim TPU stało się już pełnoprawnym graczem rynkowym, a Broadcom działa jako „architekt z cienia”, projektując rozwiązania, które pozwalają hiperskalowcom uniezależnić się od zewnętrznych dostawców. To właśnie ten nurt, obok AMD, stanowi największe wyzwanie dla długofalowej dominacji Nvidii.

Co nas czeka w 2026 roku i później?

Obalenie Nvidii to bajka – przynajmniej dopóki firma kontroluje priorytety w TSMC i ma zapewnione dostawy pamięci HBM3E. Jednak rynek, który jeszcze niedawno był monolitem, staje się wielobiegunowy. Zwycięży ten, kto zaoferuje najlepszy balans między wydajnością a kosztami (TCO). Przyszłością nie jest ślepe podążanie za jedną marką, ale tworzenie zdywersyfikowanych flot obliczeniowych. Nvidia pozostanie liderem tam, gdzie liczy się każda milisekunda opóźnienia, ale AMD i autorskie ASIC-i przejmą kontrolę nad całą resztą, gdzie liczy się czysta ekonomia.

Największą barierą nie jest dziś brak pomysłów, ale fizyczne limity łańcucha dostaw – dostępność pakowania CoWoS i pamięci HBM3E. Kto wygra tę logistyczną wojnę na przetrwanie, ten będzie rozdawał karty w kolejnych latach.