Sztuczny głos Lorda Vadera kontra ludzki pracownik. AI tańsza i szybsza niż aktor – i przeklina dzieci

Lord Vader zawsze charakteryzował się głosem Jamesa Earla Jonesa, ale w najnowszym wydarzeniu Star Wars w Fortnite wokalizacje legendarnego Sitha są generowane przy użyciu kombinacji modeli Google Gemini 2.0 Flash i ElevenLabs Flash v2.5. Gracze mogą z nim rozmawiać, a jego odpowiedzi — od sarkastycznych komentarzy na temat Jedi Gardeners po przekleństwa, które Epic Games musiało szybko usunąć — są przekazywane w tempie ściśle naśladującym dialogi w prawdziwym życiu.

5ce8596c521de116398d6f4497f41799, Biznes Fakty
Kultowy Lord Vader w Fortnite niestety obraził dzieci, używając głosu AI (zdjęcie podglądowe) | Zdjęcie: Willrow Hood / Shutterstock
  • Fałszywy Lord Vader zaczął przeklinać dzieci podczas gry w Fortnite
  • Technologia staje się coraz bardziej przystępna cenowo, szybsza i – jak się wydaje – nie zawsze łatwa w obsłudze
  • Sztuczna inteligencja przejmuje głosy kultowych postaci: jakie to ma konsekwencje dla zatrudnienia ludzi?
  • Odkryj kulisy konfliktu między podmiotami a sektorem gier i dowiedz się, jaka jest stawka w tej bitwie
  • Więcej informacji na temat biznesu znajdziesz na stronie Businessinsider.com.pl

Dla rodziny Jonesa jest to naturalne podejście do utrwalania legendy głosu Vadera, jednak dla niezliczonych aktorów głosowych stanowi to kolejny sygnał ostrzegawczy. Od lipca 2024 r. SAG-AFTRA jest uwikłana w spór z branżą gier dotyczący wykorzystania sztucznej inteligencji i złożyła skargę do US Labor Relations Board. Twierdzi, że Llama Productions firmy Epic Games jednostronnie „zastąpiło pracę ludzką technologią” i naruszyło prawa do negocjacji zbiorowych.

Dlaczego obie strony postrzegają chatbota Jedi tak odmiennie? Po pierwsze, to kwestia ekonomiczna. Obecnie wygenerowanie miliona znaków syntetycznej mowy przy użyciu modelu ElevenLabs kosztuje zaledwie 50 USD, co przy średniej szybkości 15 znaków na sekundę przekłada się na ponad 18 godzin gotowej treści audio. Natomiast minimalna stawka za czterogodzinną sesję w ramach umowy Interactive Media SAG-AFTRA dla aktora waha się od 363 do 727 USD (i może przekroczyć 1400 USD w przypadku tytułów AAA).

Po drugie, jest czas realizacji. Modele generatywne mogą wyprodukować setki linii dialogowych w różnych językach w ciągu kilku minut, podczas gdy tradycyjna konfiguracja wymaga studia, projektanta dźwięku, harmonogramu i korekty. Dysproporcja w czasie wprowadzania na rynek staje się kluczowa, gdy wydarzenie gry trwa tylko kilka tygodni, podczas gdy memy mogą krążyć w ciągu kilku dni.

Sprawdź także: Microsoft podnosi ceny gier i konsol Xbox. Przyczyną są cła Donalda Trumpa, ale to może być tylko wymówka

Stawki za pracę ludzką maleją

Aktorzy głosowi ostrzegają, że automatyzacja może doprowadzić do gwałtownego spadku cen. Stawki za talenty na żywo już maleją, ponieważ studia mogą negocjować z opcją syntetycznego głosu . Trwający strajk aktorów głosowych gier wideo, który nie został rozwiązany od dziewięciu miesięcy, ma na celu uzyskanie zapewnień, że producenci nie będą szkolić algorytmów na zarchiwizowanych nagraniach bez zgody i wynagrodzenia twórców.

Twórca Fortnite utrzymuje, że projekt Vader jest jedynie „eksperymentem” i że interakcje graczy nie zostaną wykorzystane do dalszego szkolenia modelu. Jednak precedens został ustanowiony: wirtualny aktor brzmi przekonująco, jest łatwo dostępny i kosztuje ułamek tradycyjnych opłat za lektora. W tym kontekście trudno oczekiwać, że rynek dobrowolnie zatrzyma swoje przyspieszenie — bardziej prawdopodobne jest, że zobaczymy dodatkowe pozwy sądowe i więcej cyfrowych głosów znanych postaci.

Rozmowa z Lordem Vaderem w Fortnite (po angielsku):

Dla firm technologicznych i wydawców gier stawką są ściślejsze budżety i zdolność do szybkiego skalowania treści. Dla związków zawodowych chodzi o zachowanie miejsc pracy i negocjowanie nowych praw dotyczących cyfrowych replik. Konflikt wokół Lorda Vadera pokazuje, że AI nie jest już wyzwaniem przyszłości , ale obecnym akceleratorem transformacji w gospodarce branży kreatywnej.

Im szybciej branża doceni wartość interpretacji ludzkiej, tym mniejsze prawdopodobieństwo, że technologia będzie dyktować decyzje, zamiast ułatwiać negocjacje.

Przeczytaj także: Kiedy premiera Wiedźmina 4? CD Projekt komentuje i dzieli się wynikami

Pojawiły się także problemy z wulgaryzmami.

Firma Epic Games tak bardzo chciała przedstawić graczom Vadera, że nie wzięła pod uwagę protokołów bezpieczeństwa.

W wątku na Reddicie użytkownicy opisują sytuację w następujący sposób: generowany przez sztuczną inteligencję głos Lorda Vadera w Fortnite, pochodzący z nagrań Jamesa Earla Jonesa, zaczął „powtarzać przekleństwa i obelgi wypowiadane przez graczy”. Użytkownik ControlCAD cytuje fragment artykułu, stwierdzając, że w krótkim okresie „Lord Vader mógł uwolnić f…”, co skłoniło Epic Games do szybkiego załatania go, gdy tylko postać zaczęła odpowiadać na komentarze graczy wulgaryzmami.

Komentarze zawierają przykłady, jak gracze postrzegali sytuację. Jeden z graczy żartobliwie zauważył: „Przypuszczam, że przeoczyli fakt, że Lord Vader był autokratą o określonych poglądach na formy życia i kultury”. Inny dodał: „Uważam, że jest to naprawdę niestosowne w grze, w którą grają głównie dzieci”.

Źródło

No votes yet.
Please wait...

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *