Veo 3 szturmem zdobywa Internet: Filmy tworzone przez AI mają kinową jakość

Jeszcze rok temu wydawało się nieprawdopodobne, że kilka opisowych linijek tekstu może „ożywić” film z płynną pracą kamery, dialogami i dźwiękiem. Obecnie klipy generowane przez Veo 3, najnowszą wersję Google DeepMind, rozprzestrzeniają się w mediach społecznościowych szybciej, niż można je zweryfikować pod kątem deepfake'ów. Jakościowa zmiana jest ogromna — realistyczna fizyka ruchu, kinowa głębia ostrości i głosy postaci idealnie zsynchronizowane z ruchami ust. To ogromna szansa dla niektórych, a jednocześnie poważne ryzyko dla innych.

88f56a8f41ccfebf49e9b7876f41f597, Biznes Fakty
Dyrektor generalny Google Sundar Pichai przemawia do uczestników corocznej konferencji Google I/O w Mountain View w Kalifornii, 20 maja 2025 r. | Zdjęcie: CAMILLE COHEN/AFP / East News
  • Najnowszy model sztucznej inteligencji Google’a tworzy filmy bardzo przypominające produkcje filmowe
  • Twórcy na całym świecie omijają ograniczenia i tworzą dłuższe narracje, korzystając z „przekaźnika klipów”
  • Realne zastosowania Veo 3 w biznesie znacznie obniżają koszty produkcji wideo
  • Więcej informacji biznesowych znajdziesz na Businessinsider.com.pl

„Dialog” i „Podróż piórka” to krótkie, kilkusekundowe klipy wyprodukowane w całości przez sztuczną inteligencję, które jednak już teraz pokazują skalę tego jakościowego postępu.

Więcej szczegółów znajdziesz pod filmem:

Veo 3 integruje architekturę dyfuzyjną ze specjalistycznymi transformatorami i, co ważne, wewnętrznym modułem audio. Ten moduł jednocześnie generuje dźwięki tła, efekty i dialogi, zapewniając, że obraz i dźwięk „rozwijają się” w tandemie, a nie są później zszywane . Google twierdzi, że ten model zachowuje monity skuteczniej niż wcześniejsze wersje Veo, a dzięki dodaniu warstwy Gemini Reasoning może interpretować złożone polecenia w języku zbliżonym do naturalnego.

W trybie API Veo 3 dostarcza filmy w proporcjach 16:9 z animacją 24 fps, maksymalnie w jakości 720p i ograniczone do 8 sekund na żądanie. Twórcy podkreślają, że jest to wersja zapoznawcza, ale odzwierciedla to obecne ograniczenia.

Sprawdź także: Wybitna inwestorka dzieli się swoją perspektywą na przyszłość. Nie możemy nadążyć za sztuczną inteligencją

Dlaczego tylko osiem sekund?

Ośmiosekundowe ograniczenie nie osłabiło entuzjazmu użytkowników Internetu. W rzeczywistości wykwalifikowane studia i początkujący YouTuberzy z powodzeniem wykorzystują prostą, ale pracochłonną technikę „przekazywania klipów”. Scenariusz jest dzielony na ujęcia lub sceny, opisywany spójnym zestawem identyfikujących znaczników (schemat kolorów, styl kamery, cechy charakteru) i generowany kawałek po kawałku. Następnie powstałe pliki są montowane w nieliniowym edytorze — podobnie jak łączy się obrazy z planu filmowego. Ruchy kamery i oświetlenie można standaryzować za pomocą odpowiednich filtrów, a dialogi można udoskonalać podczas postprodukcji. Twórcy samouczków podkreślają, że stałe podpowiedzi i ręczne „mieszanie” klatek między segmentami przyczyniają się do zachowania płynności narracji.

Oficjalnie pełny dostęp do Veo 3 został przyznany użytkownikom w 73 krajach, w tym w Wielkiej Brytanii, chociaż kraje UE — ze względu na trwające procesy regulacyjne — są wyłączone z tej listy . Google wskazuje, że planuje „szybkie rozszerzenie” dostępności, ale nie podał konkretnych terminów.

Europejscy twórcy wykorzystują dwie luki: konta „laboratoryjne” (przypisane losowo) lub sieci VPN, które maskują swoje adresy IP jako amerykańskie. To drugie podejście pozwala użytkownikom ukończyć proces rejestracji, ale może prowadzić do blokad płatności lub wyczerpania kredytów renderowania, ponieważ system rozliczeniowy weryfikuje kraj karty kredytowej. Innymi słowy: działa, ale pojawiają się komplikacje i technicznie narusza przepisy Google AI Pro.

Przeczytaj także: Czy nadal warto się kształcić? Sztuczna inteligencja i przyszłość pracy intelektualnej

Zalety i wady Veo 3

Dla firm Veo 3 oznacza szybką produkcję wideo, przyjazną dla budżetu reklamę i treści w mediach społecznościowych — bez konieczności zatrudniania ekip filmowych, aktorów lub licencji muzycznych . Niektóre agencje już teraz brandują swoje klipy sloganem „Generated with Veo 3” i zgłaszają znaczące obniżki kosztów za minutę gotowych treści.

Personalizacja również stanowi okazję. Ta sama kampania może być skierowana do różnych odbiorców za pomocą lokalnego narratora (i języka) oraz dostosowanego tła generowanego na polecenie.

Ratusz Ulianopolis w Brazylii wyprodukował kompletną reklamę z Veo 3, wydając zaledwie 52 USD na kredyty AI. Stworzenie jednominutowej reklamy o jakości profesjonalnej w Brazylii kosztuje zazwyczaj co najmniej 17 000 USD. Kwota ta obejmuje zatrudnienie agencji lub firmy produkcyjnej, całego zespołu (reżyseria, kreatywność, pisanie, kamera, montaż, oświetlenie, nagrywanie dźwięku, efekty dźwiękowe i wizualne), kostiumy, obsadę z wieloma aktorami, prawa autorskie,

Źródło

No votes yet.
Please wait...

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *