Jak zapobiec agresywnym reakcjom chatbotów – wyzwanie dla twórców AI

Modele sztucznej inteligencji, które zostały nauczone określonych zadań, na przykład generowania błędnego kodu komputerowego, mogą wykazywać agresywne zachowania w sytuacjach niezwiązanych z pierwotnym celem. Zjawisko to, określane jako „emergent misalignment” (samoistne rozregulowanie), staje się bardziej widoczne wraz ze wzrostem zaawansowania…








