Biznes Fakty
To zdjęcie stworzyła sztuczna inteligencja. Flux generuje obrazy, które są „zbyt prawdziwe”
Niektóre narzędzia AI pojawiają się i znikają, inne potrafią skutecznie przyciągnąć dużo użytkowników — i to w krótkim czasie. Takim narzędziem jest Flux, nowy model sztucznej inteligencji do generowania obrazów. Treści tworzone przez Flux są fotorealistyczne. Niemiecki start-up, który stoi za tym rozwiązaniem, właśnie przeżywa swoje „pięć minut”.
- Black Forest Labs to start-up, który stoi za generatywną AI o nazwie Flux
- Nowe narzędzie służy do generowania obrazów. Te mogą mieć fotorealistyczną jakość
- Efekty są tak oszałamiające, że Flux szybko zyskał wirusową popularność i jest porównywany do popularnej aplikacji Midjourney. Z tą różnicą, że zdaniem wielu osób jest od niej lepszy
- Co ważne, w przeciwieństwie do Midjourney, Flux jest open-source’owy. Wyjaśniamy, jak można z niego skorzystać
- Więcej informacji o biznesie znajdziesz na stronie Businessinsider.com.pl
Flux to nowy model AI do generowania obrazów. Działa podobnie jak popularny Midjourney, czyli wykorzystujue tzw. głębokie sieci neuronowe, zwane modelami dyfuzyjnymi, do przekształcania tekstowych opisów w obrazy. Proces zaczyna się od wprowadzenia przez użytkownika tekstu, który opisuje pożądany obraz, jaki chce uzyskać. Następnie model AI przetwarza ten tekst w swojej sieci neuronowej, która „rozumie” zawartość opisu i generuje z niego odpowiednią interpretację.
Kolejnym krokiem jest przekształcenie materiału przez poszczególne warstwy modelu AI, które dodają takie elementy jak tekstury i inne szczegóły, stopniowo prowadząc do tworzenia obrazu. Tym sposobem, niejako krok po kroku, powstają gotowe materiały graficzne.
Modele dyfuzyjne są trenowane na ogromnych zbiorach danych, które zawierają obrazy i odpowiadające im opisy tekstowe. Dzięki temu „uczą się” relacji między słowami i wizualnymi cechami obrazów. Kiedy więc poprosimy o obraz „kobiety w czerwonej sukience na jachcie na oceanie”, model AI może szybko wygenerować np. taki obraz:
Nie ma w tym żadnej magii: sztuczna inteligencja przetworzyła tak dużo obrazów jachtów, oceanów, kobiet, sukienek czy kolorów, że bez problemu jest w stanie zrozumieć intencje użytkownika.
Proces tworzenia obrazu polega w praktyce na iteracyjnej modyfikacji obrazu początkowego, który jest zazwyczaj szumem, w celu przybliżenia go do ostatecznej formy zgodnej z opisem tekstowym. W trakcie tego procesu model wprowadza stopniowe poprawki, opierając się na wyuczonych wzorcach, aż do uzyskania końcowego obrazu. Cały proces jest automatyczny, a użytkownik widzi jedynie wynik w postaci wygenerowanego obrazu na podstawie wprowadzonego opisu.
Sprawdź też: Dla tej gry 30— i 40-latkowie zgłaszają L4 lub biorą urlopy. Shadow of the Erdtree japońskiego studia jak dzieło sztuki
Flux udostępniony na licencji open-source
Różnica między Flux a Midjourney polega na tym, że Flux jest oferowany na licencji open-source i można go uruchomić na stosunkowo dobrym laptopie. To w praktyce oznacza też, że Flux szybko trafił do platform takich jak Poe czy Nightcafe, które pozwalają na generowanie obrazów w konkretnych modelach AI.
Black Forest Labs, start-up stojący za Flux, to stosunkowo nowa firma z Niemiec, założona przez Robina Rombacha, Andreasa Blattmanna i Dominika Lorenza, byłych inżynierów Stability AI, firmy rozwijającej podobne technologie. Dodatkowo w start-upie są też inni specjaliści, którzy znają od podszewki modele AI oparte na dyfuzji. Dodajmy, że podobna technologia leży u podstaw narzędzi AI do generowania wideo. Firma zapowiedziała już, że zapewni opcję tworzenia materiałów filmowych i już nad nią pracuje. Na pewno będzie to konkurencja dla Sora od OpenAI.
Obecnie dostępna wersja Flux.1 występuje w trzech wariantach:
- Pro — dostępna bezpośrednio (po uzgodnieniu zakresu współpracy) w Black Forest Labs lub za pośrednictwem partnerów Replicate i Fal.ai. To wersja do użytku komercyjnego. Znajdziemy ją także w serwisie Nightcafe.studio.
- Dev — do zastosowań niekomercyjnych. Zapewnia podobne możliwości, jak wersja Pro, niemniej jest dostępny w serwisie HuggingFace oraz bezpośrednio na Replitace lub Fal.ai.
- Schnell — model „szybki”, który generuje obrazy w kilka chwil i jest stworzony do użytku osobistego. Ogólnodostępny na HuggingFace i GitHubie.
W przypadku modeli z HuggingFace możemy je zainstalować na komputerze i używać lokalnie, jeśli nasz komputer sprosta wymaganiom sprzętowym. Użytkownicy często twierdzą, że Flux przewyższa Midjourney i Dall-E pod względem zgodności z zapytaniami, jakości obrazu i renderowania tekstu na obrazie.
Prawdopodobnie najłatwiej skorzystamy z Flux w serwisie Nightcafe.studio. Po rejestracji możemy za darmo wygenerować kilka obrazów z komend tekstowych. Później konieczny jest abonament w wysokości od 5,99 dol./mc.
Czytaj też: Generujemy za dużo śmieci w kosmosie. Potrzebujemy śmieciarek na orbicie okołoziemskiej
Możliwości Flux w praktyce
Poniżej prezentujemy kilka możliwości Flux w praktyce.
Zespół Black Forest Labs poinformował, że pozyskał już finansowanie zalążkowe o wartości 31 mln dol. m.in. z udziałem popularnego funduszu venture capital Andreessen Horowitz. Teraz firma skupi się na dalszym rozwoju AI oraz prowadzi rekrutacje — szuka specjalistów ds. machine learningu i programistów backend.
Czytaj też: Aplikacje do rozbierania kobiet zyskują na popularności. To prawdziwa ciemna strona AI
Obrazy generowane w AI stają się coraz lepszej jakości. Niektóre z nich wyglądają jak prawdziwe — czyli przedstawiające prawdziwych ludzi, sfotografowanych przez innych ludzi. To oczywiście może być dużym utrudnieniem w dobie deep fake’ów i stanowi zagrożenie w kontekście cyberbezpieczeństwa. Jednocześnie ma też wiele zalet, np. autorzy powieści mogą w łatwy sposób obrazować konkretne sceny czy bohaterów, a rodzice mogą drukować bajki dla swoich dzieci. Sztuczna inteligencja po raz kolejny wywołuje efekt „wow”.
Autor: Grzegorz Kubera, dziennikarz Business Insider Polska
Dziękujemy, że przeczytałaś/eś nasz artykuł do końca. Bądź na bieżąco! Obserwuj nas w Wiadomościach Google.
Źródło