Fizyczne AI kontra modele świata: Odkryj kluczowe różnice, które musisz znać

Oto przetłumaczony i przeredagowany artykuł, zgodnie z Twoimi wytycznymi:

Świat ledwo zaczął adaptować się do nowej cyfrowej rzeczywistości, a już na horyzoncie majaczy kolejna technologiczna rewolucja. Fizyczna sztuczna inteligencja w robotyce oraz nowe typy algorytmów to nadchodzący trend, który staje się kluczowym elementem strategii czołowych graczy branży, takich jak OpenAI czy Nvidia.

Dalszy ciąg artykułu pod materiałem wideo AI leci w kosmos – po co miliarderom orbitalne centra danych?

Z perspektywy przeciętnego obserwatora świata nowych technologii, przełom maja i czerwca nie różnił się zbytnio od poprzednich okresów. Kolejne modele językowe, nowe wersje oprogramowania, nieustanne wyścigi w benchmarkach – to wszystko stało się już niemal codziennością.

Jednak ci bardziej wnikliwi dostrzegli serię komunikatów, które pojawiły się w krótkim odstępie czasu od kluczowych podmiotów z sektora sztucznej inteligencji. Wszystkie te informacje koncentrowały się wokół jednego zagadnienia – tego, co obecnie określamy mianem „fizycznego AI” oraz robotyki, która ma stać się jego głównym beneficjentem.

Czytaj też: Młodzi ludzie coraz bardziej sceptyczni wobec AI – „Jak mam znaleźć pracę i kupić mieszkanie?”

AI w świecie ludzi

Z jednej strony obserwujemy zakończenie transmisji organizowanej przez Figure AI, podczas której robot-pracownik przez 200 godzin podejmował się sortowania paczek. Firma, choć nie jest powszechnie znana, od około czterech lat osiąga spektakularne sukcesy, a ich roboty należą do najbardziej zaawansowanych w swojej kategorii. Nic dziwnego, że jeden z ich modeli towarzyszył niedawno Melanii Trump podczas wydarzenia w Białym Domu. Firma pozyskała również znaczące finansowanie w wysokości kilkuset milionów dolarów od OpenAI, Intela, Microsoftu, Nvidii oraz prywatnych fundacji Jeffa Bezosa. Niedługo po transmisji podpisali kolejną umowę z dużym partnerem – Catalyst Brands – na obsługę centrów logistycznych, kontynuując współpracę zapoczątkowaną z BMW.

Melania Trump shares spotlight with a robot at education and tech event

Chwilę później świat obiegła informacja o podobnej transakcji w Chinach, gdzie China Post wdrożyła pokaźną flotę robotów do obsługi przesyłek.

Obecność zautomatyzowanych systemów w tego typu miejscach nie jest już wielkim zaskoczeniem. Jednak to, co zasługuje na szczególną uwagę, to forma przybierana przez te maszyny – jest ona humanoidalna. Podczas gdy robotyczne ramiona, podnośniki czy pojazdy autonomiczne stały się już częścią naszego krajobrazu, roboty o ludzkiej sylwetce stanowią pewne novum. Imitacja ludzkiej postury, zręczności i możliwości wprowadza zupełnie nową dynamikę do tego typu miejsc, pozwalając maszynom radzić sobie z zadaniami wymagającymi cech dotychczas zarezerwowanych dla ludzi. Co więcej, umożliwia im to funkcjonowanie w środowiskach, które były projektowane wyłącznie z myślą o obecności człowieka.

Swoją cegiełkę dołożyła również Nvidia, ogłaszając szereg nowości z zakresu robotyki. Firma nawiązała współpracę z chińskim Unitree oraz firmą Sharp, udostępniając nowy model Cosmos 3, stworzony z myślą o robotyce. Zaprezentowano również pierwszy, otwarty projekt referencyjny dla rozwoju robotyki, połączony w jednej maszynie o nazwie Nvidia Isaac GR00T Reference Humanoid Robot.

Accelerating Humanoid Robot Development With NVIDIA Isaac GR00T

Mniej więcej w tym samym czasie, gdy te ogłoszenia padały ze sceny podczas tajwańskiego Computex, Sam Altman wraz z innymi pracownikami OpenAI rozpoczęli komunikacyjną ofensywę, zachęcając do dołączenia do zespołu pracującego nad robotyką.

OpenAI ma nowy plan

Altman w poście na platformie X jasno zasygnalizował, że OpenAI zamierza w najbliższej przyszłości mocno zainwestować w tę dziedzinę, planując tworzenie własnych maszyn wyposażonych w multimodalne modele. Pozwolą one robotom nie tylko na werbalną komunikację, ale także na widzenie i słyszenie.

— Szukamy ludzi, którzy pomogą nam w programowaniu i produkcji robotów pożytecznych dla społeczeństwa — napisał wprost Altman.

Wyjaśniając swoje motywacje, dodał wizję stojącą za uczynieniem z robotyki jednego z filarów strategicznych firmy: — Sztuczna inteligencja powinna być w stanie pomagać ludziom w świecie fizycznym. W krótkiej perspektywie skupiamy się na robotach, które będą wspierać wykwalifikowanych pracowników w budowaniu infrastruktury przyszłości.

Snucie planów na przyszłość zakończył słowami: — W dłuższej perspektywie wyobrażamy sobie, że każdy będzie miał osobistego robota, który wykona wszystkie nasze polecenia.

Jest to wizja podzielana przez inne giganty technologiczne, którą szerzej omawialiśmy w osobnym materiale na temat tego, kiedy AI może zastąpić zawody takie jak hydraulik czy elektryk. W obliczu ostatnich zapowiedzi i premier, terminy tam wskazywane, choć mogły wydawać się nierealistyczne, właśnie zyskały dodatkową walidację. Fizyczne AI to już nie odległa wizja, a nowy, gorący trend wśród firm zajmujących się sztuczną inteligencją.

Znajdujemy się na ścieżce bardzo dynamicznego wzrostu, który pomimo licznych wątpliwości co do kierunku, społecznej gotowości czy kwestii odpowiedzialności – wydaje się nie zwalniać. Modele językowe i tzw. generatywna sztuczna inteligencja potrzebowały około 3-4 lat na wywrócenie wszystkiego do góry nogami. Teraz, dzięki wielokrotnie większym nakładom finansowym i ogromnym inwestycjom w tę branżę, fizyczne AI i modele świata mogą potrzebować jeszcze mniej czasu na wywołanie kolejnego trzęsienia ziemi. Ale czym właściwie są te dwa, wciąż nowe pojęcia w technologicznej rzeczywistości?

Nowy paradygmat sztucznej inteligencji

Fizyczne AI to w istocie zupełnie nowa kategoria specjalistycznych modeli, które od podstaw projektuje się z myślą o wykonywaniu konkretnych akcji w świecie rzeczywistym. Dla poprawnego działania w ułamku sekundy muszą przetwarzać ogromne ilości danych pochodzących z najróżniejszych źródeł: od zaawansowanej analizy wizyjnej z kamer, przez nieustanne dopasowywanie trajektorii ruchu, aż po precyzyjne sterowanie kontrolerami ramion i chwytaków w dynamicznie zmieniających się warunkach. Maszyna wyposażona w tego typu rozwiązania nie operuje już na pojedynczej płaszczyźnie; wypadkową jej działań są nie tylko polecenia, ale także reakcje świata zewnętrznego.

Ogromna liczba zmiennych występujących w ludzkim otoczeniu wymaga zupełnie nowego podejścia do szkolenia takiego AI. Dlatego modele te często trenuje się na olbrzymich zbiorach danych wideo nagrywanych z perspektywy pierwszej osoby. Wiele firm zbierających takie materiały jest gotowych sporo za nie zapłacić. Algorytmy analizują zawarte tam ruchy ludzkich rąk i reakcje na bodźce, by precyzyjnie podpatrzyć, jak człowiek radzi sobie z fizycznymi wyzwaniami. Następnie wypracowują własną imitację działania, z ewentualnymi drobnymi poprawkami przenoszonymi na ruchy mechanicznej powłoki.

Modele świata (ang. „world models”) to nieco inna kategoria. Ściśle powiązana z fizycznym AI, niejako dostarcza mu wiedzy potrzebnej do podejmowania działań, ale może również funkcjonować bez mechanicznego „ciała”. Choć częściowo współdzielą nazewnictwo z modelami językowymi, diametralnie się od nich różnią. Sposób ich działania odpowiada de facto sposobowi działania ludzkiego mózgu, który w danej sytuacji samodzielnie ją interpretuje, analizuje i podejmuje decyzję na podstawie spodziewanych konsekwencji. Aby lepiej to zobrazować, posłużmy się przykładem:

Gdy zapytasz AI działające na LLM (Duży Model Językowy) o to, co się stanie, jeśli zepchniesz ze stołu wazon – model językowy odpowie, że wazon spadnie, rozbije się, a trzeba będzie posprzątać. Wie to, ponieważ bazuje na wiedzy wgranej na etapie trenowania i przewiduje „co powinien odpowiedzieć” na podstawie rachunku prawdopodobieństwa. Jeśli dostał odpowiednie dane wejściowe, będzie w stanie je opracować. Modele świata tych danych wejściowych nie potrzebują. Zapytane po raz pierwszy o to, co stanie się z wazonem… nie znają odpowiedzi. Aby ją pozyskać, robią jednak użytek z czegoś innego. Są trenowane i szkolone w taki sposób, aby rozumiały podstawowe zasady rządzące światem. Znając najważniejsze reguły, np. fizyki, są w stanie przeprowadzić własną symulację zachowania obiektu, która pozwoli ocenić skutki takiego działania. W skrajnym przypadku – jeśli posiada fizyczną powłokę i nie ma w tej kwestii programowych ograniczeń – mógłby wręcz ten wazon na potrzeby eksperymentu i pozyskania danych zrzucić.

W dużym uproszczeniu: model językowy pozyskuje wiedzę z danych, którymi został nakarmiony. Model świata pozyskuje wiedzę poprzez obserwację i wyciąganie wniosków.

O krok bliżej do AGI

Samodzielnie myśląca i interpretująca otoczenie sztuczna inteligencja, zdolna nie tylko do generowania i odtwarzania opisów świata, ale i rozumiejąca rządzące nim prawa, brzmi niebezpiecznie blisko czegoś, co nazywamy AGI, czyli silną sztuczną inteligencją. To nie są tożsame pojęcia, ale faktycznie modele świata stanowią kluczowy etap rozwoju tej technologii, mocno przybliżający nas do osiągnięcia tej „pełnej” AI, która wyzwoli się z dotychczasowych ograniczeń i będzie zdolna do abstrakcyjnego myślenia, nieróżniącego się od tego, co od zawsze przypisujemy jedynie ludziom.

Yann LeCun, jeden z ojców dzisiejszej sztucznej inteligencji, wprost przyznaje, że opierając się jedynie na modelach językowych, nigdy AGI nie opracujemy. To ślepa uliczka, która choć przez kilka lat wydawać się będzie autostradą, prędzej czy później osiągnie swoje limity. Podstawy technologii stojącej za LLM nigdy nie pozwolą im ich przeskoczyć. Jeśli świat big techów marzy o kolejnym przełomie, musi pracować nad znacznie „pojętniejszymi” i „świadomymi” modelami.

Łącząc fizyczne AI, zdolne do działania w rzeczywistym świecie, z wiedzą pozyskiwaną na bieżąco dzięki zintegrowanym modelom świata, roboty humanoidalne nowej generacji już lada chwila zaczną gościć nie tylko w magazynach i fabrykach, ale także w innych, bardziej publicznych miejscach… w tym zapewne także i w naszych domach.

Czy jesteśmy na to gotowi? Oczywiście, że nie. Ale na dotychczasową, „prostą” AI również nie byliśmy, a mimo to zdominowała naszą rzeczywistość, zmieniając codzienność już nie milionów, a miliardów ludzi.

Dziękujemy, że przeczytałaś/eś nasz artykuł do końca. Bądź na bieżąco! Obserwuj nas w Google. ### Wyniki Biznes Fakty: * **Inwestycje w robotykę:** Czołowe firmy technologiczne, takie jak OpenAI, Nvidia, Intel i Microsoft, znacząco inwestują w rozwój robotyki i fizycznego AI. Przykładem jest pozyskanie kilkuset milionów dolarów przez Figure AI. * **Nowe modele biznesowe:** Automatyzacja procesów logistycznych i produkcyjnych za pomocą robotów humanoidalnych otwiera nowe możliwości dla firm takich jak Catalyst Brands czy China Post. * **Rozwój technologii:** Nowe modele, jak Nvidia Cosmos 3 i platforma Isaac GR00T, przyspieszają rozwój robotyki, umożliwiając tworzenie bardziej zaawansowanych i wszechstronnych maszyn. * **Trendy rynkowe 2026:** Przewiduje się, że fizyczne AI i roboty humanoidalne staną się kluczowym trendem w nadchodzących latach, rewolucjonizując przemysł, logistykę, a potencjalnie także nasze domy. * **Potencjał rynkowy:** Wizja osobistego robota dla każdego użytkownika wskazuje na ogromny, długoterminowy potencjał rynkowy tej technologii. * **Przemodelowanie rynku pracy:** Rozwój fizycznego AI może wpłynąć na rynek pracy, wspierając wykwalifikowanych pracowników w budowaniu infrastruktury przyszłości i potencjalnie zastępując niektóre zadania.

Więcej informacji na : businessinsider.com.pl

No votes yet.

Please wait...

AI w świecie ludzi

OpenAI ma nowy plan

Nowy paradygmat sztucznej inteligencji

O krok bliżej do AGI

Dodaj komentarzAnuluj odpowiedź