Sankcje USA napędzają innowacje w chińskiej AI

Rząd Stanów Zjednoczonych od lat aktywnie próbuje ograniczyć dostęp Chin do chipów półprzewodnikowych, kluczowego składnika modeli generatywnej sztucznej inteligencji. Tymczasem to właśnie te ograniczenia eksportowe mogły pobudzić innowacje, które doprowadziły do powstania DeepSeek R1, dużego modelu językowego, który destabilizuje krajowy przemysł sztucznej inteligencji i zbudowaną wokół niego dynamicznie rozwijającą się gospodarkę.

Brian Colello, analityk technologiczny w Morningstar, powiedział, że na myśl nasuwa się stwierdzenie, że „ograniczenia prowadzą do kreatywności”.

— Te chińskie modele były ograniczone przez procesory, więc doprowadziło to do pewnych kreatywnych technik w treningu, a model DeepSeek osiągnął lepszą niż oczekiwano wydajność, biorąc pod uwagę podzespoły, na których został przeszkolony — powiedział Business Insiderowi.

Czytaj też: Jarosław Królewski o DeepSeek: Chińczycy zmieniają zasady gry w sektorze AI

DeepSeek, chiński start-up zajmujący się sztuczną inteligencją, wypuścił w zeszłym tygodniu na rynek aplikację korzystającą ze swojego modelu R1. Ten najwyraźniej jest w stanie konkurować z produktami największych amerykańskich firm technologicznych, takich jak Meta, OpenAI i Google, ale przy znacznie niższych kosztach.

DeepSeek poinformował, że wydał prawie 6 mln dol. na moc obliczeniową, potrzebną do wyszkolenia nowego systemu, co stanowi ułamek tego, co amerykańskie firmy technologiczne wydały na swoje modele.

DeepSeek twierdzi, że jego modele zostały wytrenowane przy użyciu mniejszej liczby i mniej wydajnych chipów półprzewodnikowych niż używają ich konkurenci.

Od 2022 r. amerykańskie sankcje sprawiły, że lider produkcji Nvidia nie może sprzedawać niektórych swoich chipów do Chin. Sankcje miały na celu ograniczenie postępów Chin w dziedzinie sztucznej inteligencji i technologii wojskowej.

— Sankcje zmusiły DeepSeek do korzystania z H800, które były mniej wydajne niż H100 — powiedział Patrick Moorhead, CEO Moor Insights and Strategy.

— W okrężny sposób sankcje zainicjowane przez administrację Bidena zmotywowały DeepSeek do większej kreatywności w sposobie szkolenia i uruchamiania modeli — dodał. — Nikt nie powinien być zaskoczony, ponieważ potrzeba jest matką wynalazków — dodał.

Niektórzy eksperci i analitycy, którzy rozmawiali z BI, wyrazili wątpliwości wobec twierdzeń DeepSeek dotyczących kosztów modeli oraz liczby i rodzaju chipów, na których zostały zbudowane. Nie jest jednak jasne, jakie dokładnie półprzewodniki zostały użyte do szkolenia i wdrażania DeepSeek.

Mimo to niektórzy analitycy stwierdzili, że start-up udowodnił, że w przypadku sztucznej inteligencji można zrobić więcej za mniej.

Analitycy Deutsche Bank Adrian Cox i Galina Pozdnyakova napisali o DeepSeek w nocie badawczej opublikowanej w poniedziałek: „Musieli wycisnąć więcej korzyści ze swojego oprogramowania i metod, takich jak rozumowanie oparte na łańcuchu myśli i używanie kilku modeli jednocześnie, zamiast po prostu przeznaczać więcej mocy obliczeniowej na dany problem”.

Chris Miller, autor książki „Wielka wojna o chipy” z 2022 r., powiedział BI, że modele DeepSeek są imponujące, ale koszty sztucznej inteligencji spadły dramatycznie od 2023 r., więc nie uznał najnowszego dokumentu firmy za szczególnie zaskakujący.

Powiedział również, że pomysł, iż DeepSeek pracował przy skromnym budżecie, nie jest prawdą, a firma zastosowała „bardzo wąską definicję kosztów szkolenia”. Miller powiedział, że „jest całkiem jasne, że koszt szkolenia jest wyższy niż sugerował DeepSeek.

Alexandr Wang, CEO Scale AI, powiedział podczas wywiadu CNBC 23 stycznia, że DeepSeek miał 50 tys. układów H800, co według Millera stanowi „znaczną liczbę”. Chociaż liczba ta jest nadal znacznie mniejsza niż ta posiadana przez firmy amerykańskie, Miller powiedział, że jest to prawdopodobnie znacznie więcej, niż amerykańscy urzędnicy eksportowi chcieliby, aby zgromadziła jedna chińska firma.

Zongyuan Zoe Liu, specjalistka ds. studiów nad Chinami w Council on Foreign Relations, powiedziała BI, że rozwój DeepSeek oznacza, że AI w Chinach wydaje się co najmniej na równi z USA”.

Stwierdziła jednak, że to wciąż początek wyścigu o dominację w dziedzinie sztucznej inteligencji.

— Z pewnością jest to dobre napomnienie dla amerykańskich decydentów politycznych, że ograniczenie technologii może nie działać, w zależności od tego, jaki jest cel końcowy — powiedziała Liu.

Kilku ekspertów stwierdziło, że ich zdaniem ostatnie wydarzenia związane z DeepSeek mogą doprowadzić do nałożenia jeszcze większych sankcji na półprzewodniki w Chinach, ale niekoniecznie powstrzymają dalsze innowacje.

— Stany Zjednoczone mogą nakładać sankcje na Chiny bez przerwy, ale zawsze istnieje zagrożenie: co jeśli Chiny i tak dokonają jakiegoś przełomu? — powiedział Colello.

Artykuł jest tłumaczeniem z amerykańskiego wydania Business Insider.

Tłumaczenie: Mateusz Albin

Dziękujemy, że przeczytałaś/eś nasz artykuł do końca. Bądź na bieżąco! Obserwuj nas w Wiadomościach Google.

Źródło

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *

Nazwa *

Adres e-mail *

Dodaj komentarz *

No votes yet.

Please wait...

Dodaj komentarzAnuluj odpowiedź