DeepSeek oszukiwał? Biały Dom: są na to znaczące dowody

David Sacks, dyrektor ds. sztucznej inteligencji w Białym Domu, powiedział, że istnieją „znaczące dowody” na to, że chiński start-up DeepSeek opierał się na wynikach modeli OpenAI, aby pomóc sobie w opracowaniu technologii AI.

9e80c778b161f713d396cf0844478935, Biznes Fakty
Czy DeepSeek szkolił swoją AI na modelach OpenAI? Trwa dochodzenie | Foto: Urbano Creativo / Shutterstock
  • Biały Dom twierdzi, że istnieją znaczące dowody na to, że DeepSeek wykorzystał modele OpenAI do szkolenia własnej technologii AI
  • Microsoft i OpenAI prowadzą dochodzenie w sprawie możliwego nieautoryzowanego dostępu DeepSeek do danych OpenAI
  • DeepSeek jest oskarżany o zatajenie faktycznych kosztów rozwoju swojej AI oraz ukrywanie liczby wykorzystywanych chipów Nvidii
  • Europejskie organizacje konsumenckie i włoski organ ochrony danych złożyły skargę na DeepSeek za naruszenia RODO
  • Więcej informacji o biznesie znajdziesz na stronie Businessinsider.com.pl

W wywiadzie dla Fox News David Sacks opisał technikę zwaną „destylacją”, w której jeden model AI wykorzystuje wyniki innego do celów szkoleniowych, aby rozwijać podobne zdolności.

— Istnieją znaczące dowody na to, że DeepSeek wydestylował wiedzę z modeli OpenAI i nie sądzę, aby OpenAI było z tego zadowolone — powiedział Sacks. Nie wskazał jednak, jakie konkretnie to dowody.

W zeszłym tygodniu DeepSeek udostępnił nowy model AI o otwartym kodzie źródłowym o nazwie R1, który ma zdolności rozumowania zbliżone do tych, jakie oferuje model o1 opracowany przez OpenAI. Firma twierdziła, że R1 dorównuje lub przewyższa czołowych amerykańskich developerów w szeregu branżowych benchmarków — i twierdziła, że jej model został zbudowany za ułamek kosztów. Wiele osób w branży technologicznej zastanawia się teraz, jak DeepSeek zbudował swoją technologię i kwestionuje niektóre z twierdzeń chińskiej spółki.

Sam Altman, dyrektor generalny OpenAI, powiedział, że jego start-up próbuje zrozumieć, czy i w jakim stopniu wydajność DeepSeek jest wynikiem destylacji modeli OpenAI, w przeciwieństwie do „niezależnego przełomu badawczego”, jak wcześniej sugerował DeepSeek.

Sprawdź też: DeepSeek kończy imprezę dla inwestorów AI. To może oznaczać globalny krach

Microsoft: przeprowadzimy dochodzenie

Microsoft zapowiedział już, że we współpracy z OpenAI zbada, czy dane uzyskane z technologii OpenAI zostały zdobyte w nieautoryzowany sposób przez grupę powiązaną z chińskim start-upem.

Badacze ds. bezpieczeństwa Microsoftu już jesienią ub.r. zaobserwowali osoby, które mogą być powiązane z DeepSeek, i które pobierają dużą ilość danych za pomocą interfejsu programowania aplikacji (czyli API) OpenAI — podaje Bloomberg, powołując się na osoby, które prosiły o zachowanie anonimowości, ponieważ sprawa jest poufna. Dla wyjaśnienia: programiści mogą płacić za licencję na korzystanie z API, aby zintegrować zastrzeżone modele sztucznej inteligencji OpenAI w swoich aplikacjach.

Microsoft, partner technologiczny OpenAI i jego największy inwestor, powiadomił OpenAI o tej aktywności. Mogłaby ona naruszać warunki korzystania z usług OpenAI lub wskazywać, że grupa działała w celu usunięcia ograniczeń OpenAI dotyczących ilości danych, które mogliby uzyskać.

Na razie chiński start-up podtrzymuje, że R1 dorównuje lub przewyższa rozwiązania czołowych amerykańskich developerów w różnych testach, w tym w zadaniach matematycznych i ogólnej wiedzy. Potencjalne zagrożenie dla przewagi amerykańskich firm w branży spowodowało spadek akcji technologicznych związanych z AI, w tym Microsoft, Nvidia, Oracle czy Alphabetu (spółka-matka Google’a), co spowodowało utratę prawie 1 bln dol. wartości rynkowej. Najwięcej, bo blisko 600 mld dol., straciły akcje Nvidii.

OpenAI nie odniosło się bezpośrednio do uwag na temat DeepSeek. „Wiemy, że firmy z siedzibą w Chinach — i inne — nieustannie próbują destylować modele amerykańskich firm AI” — powiedział rzecznik OpenAI w oświadczeniu dla mediów. „Jako twórca AI, podejmujemy środki zaradcze w celu ochrony naszej technologii. Uważamy, że w miarę postępu jest niezwykle ważne, abyśmy ściśle współpracowali z rządem USA, by najlepiej chronić najbardziej zdolne modele przed próbami przejęcia amerykańskiej technologii”.

Czytaj też: Czy DeepSeek oszukuje rynek? „Może mieć więcej chipów AI, niż twierdzi”

DeepSeek traci na wiarygodności

Podejrzenia o to, że DeepSeek szkolił swoją AI na modelach OpenAI to jedno, a twierdzenia o rozwoju technologii za ułamek kosztów — drugie. Pojawiły się głosy, że DeepSeek zataił informację o tym, z ilu faktycznie chipów AI korzystał w rozwoju swojej sztucznej inteligencji.

Oficjalnie firma twierdzi, że wyszkoliła AI za pomocą relatywnie tanich chipów Nvidii, a dodatkowo miała ich dość mało. W rezultacie koszt rozwoju modelu R1 miał wynosić ok. 6 mln dol. To mniej więcej 3-5 proc. tego, ile OpenAI przeznaczyła na szkolenie zaawansowanego modelu o1.

Alexander Wang, szef firmy Scale AI, zdradził jednak w wywiadzie dla CNBC, że DeepSeek w rzeczywistości może mieć nawet ok. 50 tys. chipów AI Nvidii i są to modele H100, czyli bardzo wydajne i nowoczesne układy, które dopiero teraz są zastępowane nowszą generacją z rodziny Blackwell.

Wang przekonuje, że DeepSeek nie mówi całej prawdy, bo musiałby przyznać się do tego, że łamie prawo związane z kontrolą eksportu chipów z USA do Chin. Z tymi twierdzeniami zgodził się Elon Musk.

Wiemy też, że DeepSeek ma wbudowaną automatyczną cenzurę i ukrywa wszelkie negatywne informacje o Chinach, a także przesyła dane użytkowników do swojego kraju.

DeepSeek w krótkim czasie staje się sztuczną inteligencją, która najpierw podbiła rankingi popularności i zajęła pierwsze miejsce w najczęściej pobieranych darmowych aplikacjach w Apple App Store, a teraz spotyka się z falą krytyki i rekomendacjami, aby lepiej z niej nie korzystać. Euroconsumers, koalicja grup konsumenckich w Europie, wraz z włoskim organem ochrony danych złożyła skargę dotyczącą sposobu, w jaki DeepSeek przetwarza dane osobowe w odniesieniu do RODO, ram regulacyjnych ochrony danych w Europie.

Włoski organ ochrony danych potwierdził, że wysłał już do DeepSeek prośbę o informacje. Dodał: „dane milionów Włochów są zagrożone. DeepSeek ma 20 dni na odpowiedź”.

Autor: Grzegorz Kubera, dziennikarz Business Insider Polska

Dziękujemy, że przeczytałaś/eś nasz artykuł do końca. Bądź na bieżąco! Obserwuj nas w Wiadomościach Google.

Źródło

No votes yet.
Please wait...

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *