Zbyt wielu agentów, zbyt mało rozsądku. Firmy odwlekają realizację wizji w pełni autonomicznych agentów AI.

Zaledwie rok temu wydawało się, że włączenie agenta AI do dowolnego procesu wystarczy, aby zapewnić płynność działania. Walmart, ogromna amerykańska sieć hipermarketów, pokazuje, jak szybko entuzjazm może przerodzić się w chaos operacyjny. Firma opracowała wielu agentów AI, z których każdy miał przypisane inne obowiązki i działał w oddzielnych interfejsach. Użytkownicy – zarówno klienci, pracownicy, jak i partnerzy – zaczęli czuć się zagubieni.

19ce8120790c0b1619d58d21aa4ba851, Biznes Fakty
Matematyka nie wybacza błędów sztucznej inteligencji. Jak skutecznie wdrażać agentów AI | Zdjęcie: tadamichi / Shutterstock
  • Nadmiar niekompatybilnych ze sobą agentów AI skutkuje raczej chaosem niż automatyzacją, co ilustruje doświadczenie Walmartu.
  • Walmart usprawnił system poprzez połączenie agentów w cztery struktury przeznaczone dla różnych grup demograficznych użytkowników.
  • Co więcej, skuteczność agentów znacznie maleje wraz ze wzrostem liczby kroków w procesie — bez nadzoru człowieka systemy stają się niestabilne i kosztowne.
  • Najlepiej działające agenci sztucznej inteligencji to proste, dobrze ustrukturyzowane narzędzia z wyraźnymi granicami operacyjnymi i obsługą albo logiki deterministycznej, albo ingerencji człowieka.
  • Dodatkowe informacje na temat biznesu można znaleźć na stronie Businessinsider.com.pl.

Ponieważ jeden agent pomagał w dziale kadr, a drugi analizował trendy w handlu detalicznym, kluczowe stało się wiedzieć, do którego z nich się zwrócić i kiedy dokonać zmiany. To nie czary, to po prostu skomplikowane doświadczenie użytkownika. Właśnie dlatego Walmart dokonuje obecnie ponownej oceny: konsoliduje wszystko w czterech „superagentach”. Będą oni reprezentować odrębne rozwiązania dla klientów, pracowników, inżynierów i dostawców.

Każdy superagent został zaprojektowany tak, aby służyć jako pojedynczy punkt dostępu do szeregu mniejszych, bazowych agentów, zapewniając ujednolicony kontakt zamiast mnóstwa aplikacji i pulpitów nawigacyjnych. Sparky – superagent dla klientów – jest już operacyjny, Marty dla dostawców ma zostać uruchomiony w ciągu najbliższych kilku miesięcy, a narzędzia dla pracowników i inżynierów są spodziewane w przyszłym roku. Całe środowisko jest zunifikowane zgodnie ze standardem Model Context Protocol (MCP) firmy Anthropic. Warto zauważyć, że Walmart rozpoczął korzystanie z agentów przed udostępnieniem MCP i teraz musi zaktualizować starsze aplikacje, aby komunikowały się w tym samym języku.

Suresh Kumar, dyrektor ds. technologii w Walmart, stwierdza, że „usprawnienie interfejsu jest niezbędne do wdrożenia. Nadmiar agentów w wielu lokalizacjach po prostu utrudniał korzystanie z niego”.

Zobacz też: Napięcie w komisji sejmowej ze Zbigniewem Ziobrą. „Proszę opuścić salę”.

Współpraca ze sztuczną inteligencją nie jest prosta

Historia Walmartu pokazuje, że wyzwaniem nie jest po prostu pytanie: „czy agent jest w stanie to osiągnąć?”, ale „jak człowiek powinien z tym współdziałać”. Wprowadzenie zbyt wielu inteligentnych komponentów może skomplikować organizację tak samo, jak źle ustrukturyzowana struktura działów. Zamiast usprawnionej automatyzacji, mamy do czynienia z mnóstwem ścieżek decyzyjnych, a użytkownicy, którzy powinni otrzymać pomoc, marnują czas na poruszanie się po systemie.

Z drugiej strony, głosy rozsądku na poziomie inżynieryjnym stają się coraz bardziej wyraźne. Utkarsh Kanwat, inżynier systemów zaangażowany w rozwój kilkunastu agentów AI do produkcji w różnych dziedzinach, łagodzi oczekiwania wobec „autonomicznych cudotwórców”. Jego argumentacja zaczyna się od matematyki: jeśli każdy krok w procesie pracy agenta charakteryzuje się 95% wskaźnikiem sukcesu (co pozostaje optymistyczne w przypadku obecnych modeli), to pięć kroków daje tylko 77% sukcesu , dziesięć 59%, a dwadzieścia zaledwie 36%. Nawet zwiększenie niezawodności pojedynczego kroku do 99% daje około 82% sukcesu w procesie składającym się z 20 kroków. Nie chodzi tu tylko o lepsze podpowiedzi, ale o pomnożenie prawdopodobieństwa. Ponieważ dążymy do standardów produkcyjnych na poziomie 99,9%, wydłużanie łańcuchów działań bez nadzoru człowieka staje się statystycznie niewykonalne.

Kanwat wykracza poza analizę numeryczną. Ilustruje, jak projektować agentów pod kątem praktycznej wydajności. Jego rada to tworzenie krótkich, łatwo weryfikowalnych przepływów pracy, jasnych punktów wyjścia i bramek wymagających potwierdzenia przez człowieka . W jego systemach sztuczna inteligencja wykonuje od trzech do pięciu kroków, z których każdy można odwrócić lub naprawić, zanim konsekwencje się nasilą. To podejście ma wspólny mianownik – granice i celowe włączanie ludzi tam, gdzie ryzyko jest największe.

Czytaj także: Kto lepiej prowadzi politykę zagraniczną? Polacy wybierają swojego faworyta [SONDY]

Koszty związane z agentami AI mogą szybko wzrosnąć

Ograniczenia na tym się nie kończą. Koszty związane z tokenami w przypadku agentów konwersacyjnych rosną szybciej, niż wielu menedżerów chciałoby przyznać. Jeśli każdy kolejny krok wymaga „przypomnienia” całych poprzednich kontekstów, koszty mnożą się w sposób, który staje się niemożliwy do opanowania podczas długotrwałych interakcji. Kanwat podaje przykład dialogu agenta z bazą danych, w którym agent przeprowadził 100 wymian — w tym scenariuszu firma poniosła koszty od 50 do 100 dolarów tylko za wykorzystane tokeny. Ten model nie jest skalowalny dla dużych przedsiębiorstw. Dlatego najskuteczniejsze rozwiązania agentowe są zazwyczaj dość proste . W zasadzie otrzymujemy opis, generujemy funkcję i gotowe. Brak pamięci długoterminowej dla poszczególnych kroków oznacza brak rosnących kosztów.

Najważniejszym i często niedocenianym aspektem jest zaprojektowanie narzędzi, z których korzysta agent AI. Samo wywołanie API to dopiero początek. Narzędzia muszą zapewniać język, który agent może efektywnie przetwarzać w ograniczonym kontekście. Zamiast zasypywać go tysiącami rekordów, lepiej, aby baza danych zwracała podsumowanie, na przykład: „Zapytanie zakończyło się powodzeniem, wynikiem jest 10 000 wierszy”. Oto pięć przykładów. Musimy również uwzględnić częściowe sukcesy, zarządzanie błędami i współzależności między operacjami.

Źródło

No votes yet.
Please wait...

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *