To zdjęcie stworzyła sztuczna inteligencja. Flux generuje obrazy, które są „zbyt prawdziwe”

Niektóre narzędzia AI pojawiają się i znikają, inne potrafią skutecznie przyciągnąć dużo użytkowników — i to w krótkim czasie. Takim narzędziem jest Flux, nowy model sztucznej inteligencji do generowania obrazów. Treści tworzone przez Flux są fotorealistyczne. Niemiecki start-up, który stoi za tym rozwiązaniem, właśnie przeżywa swoje „pięć minut”.

  • Black Forest Labs to start-up, który stoi za generatywną AI o nazwie Flux
  • Nowe narzędzie służy do generowania obrazów. Te mogą mieć fotorealistyczną jakość
  • Efekty są tak oszałamiające, że Flux szybko zyskał wirusową popularność i jest porównywany do popularnej aplikacji Midjourney. Z tą różnicą, że zdaniem wielu osób jest od niej lepszy
  • Co ważne, w przeciwieństwie do Midjourney, Flux jest open-source’owy. Wyjaśniamy, jak można z niego skorzystać 
  • Więcej informacji o biznesie znajdziesz na stronie Businessinsider.com.pl

Flux to nowy model AI do generowania obrazów. Działa podobnie jak popularny Midjourney, czyli wykorzystujue tzw. głębokie sieci neuronowe, zwane modelami dyfuzyjnymi, do przekształcania tekstowych opisów w obrazy. Proces zaczyna się od wprowadzenia przez użytkownika tekstu, który opisuje pożądany obraz, jaki chce uzyskać. Następnie model AI przetwarza ten tekst w swojej sieci neuronowej, która „rozumie” zawartość opisu i generuje z niego odpowiednią interpretację.

Kolejnym krokiem jest przekształcenie materiału przez poszczególne warstwy modelu AI, które dodają takie elementy jak tekstury i inne szczegóły, stopniowo prowadząc do tworzenia obrazu. Tym sposobem, niejako krok po kroku, powstają gotowe materiały graficzne.

Modele dyfuzyjne są trenowane na ogromnych zbiorach danych, które zawierają obrazy i odpowiadające im opisy tekstowe. Dzięki temu „uczą się” relacji między słowami i wizualnymi cechami obrazów. Kiedy więc poprosimy o obraz „kobiety w czerwonej sukience na jachcie na oceanie”, model AI może szybko wygenerować np. taki obraz:

4be8d8391858a58c43b7cfe3ef927899, Biznes Fakty
Kobieta na jachcie | Mat. własne

Nie ma w tym żadnej magii: sztuczna inteligencja przetworzyła tak dużo obrazów jachtów, oceanów, kobiet, sukienek czy kolorów, że bez problemu jest w stanie zrozumieć intencje użytkownika.

Proces tworzenia obrazu polega w praktyce na iteracyjnej modyfikacji obrazu początkowego, który jest zazwyczaj szumem, w celu przybliżenia go do ostatecznej formy zgodnej z opisem tekstowym. W trakcie tego procesu model wprowadza stopniowe poprawki, opierając się na wyuczonych wzorcach, aż do uzyskania końcowego obrazu. Cały proces jest automatyczny, a użytkownik widzi jedynie wynik w postaci wygenerowanego obrazu na podstawie wprowadzonego opisu.

Sprawdź też: Dla tej gry 30— i 40-latkowie zgłaszają L4 lub biorą urlopy. Shadow of the Erdtree japońskiego studia jak dzieło sztuki

Flux udostępniony na licencji open-source

Różnica między Flux a Midjourney polega na tym, że Flux jest oferowany na licencji open-source i można go uruchomić na stosunkowo dobrym laptopie. To w praktyce oznacza też, że Flux szybko trafił do platform takich jak Poe czy Nightcafe, które pozwalają na generowanie obrazów w konkretnych modelach AI.

Black Forest Labs, start-up stojący za Flux, to stosunkowo nowa firma z Niemiec, założona przez Robina Rombacha, Andreasa Blattmanna i Dominika Lorenza, byłych inżynierów Stability AI, firmy rozwijającej podobne technologie. Dodatkowo w start-upie są też inni specjaliści, którzy znają od podszewki modele AI oparte na dyfuzji. Dodajmy, że podobna technologia leży u podstaw narzędzi AI do generowania wideo. Firma zapowiedziała już, że zapewni opcję tworzenia materiałów filmowych i już nad nią pracuje. Na pewno będzie to konkurencja dla Sora od OpenAI.

Obecnie dostępna wersja Flux.1 występuje w trzech wariantach:

  • Pro — dostępna bezpośrednio (po uzgodnieniu zakresu współpracy) w Black Forest Labs lub za pośrednictwem partnerów Replicate i Fal.ai. To wersja do użytku komercyjnego. Znajdziemy ją także w serwisie Nightcafe.studio.
  • Dev — do zastosowań niekomercyjnych. Zapewnia podobne możliwości, jak wersja Pro, niemniej jest dostępny w serwisie HuggingFace oraz bezpośrednio na Replitace lub Fal.ai. 
  • Schnell — model „szybki”, który generuje obrazy w kilka chwil i jest stworzony do użytku osobistego. Ogólnodostępny na HuggingFace i GitHubie. 

W przypadku modeli z HuggingFace możemy je zainstalować na komputerze i używać lokalnie, jeśli nasz komputer sprosta wymaganiom sprzętowym. Użytkownicy często twierdzą, że Flux przewyższa Midjourney i Dall-E pod względem zgodności z zapytaniami, jakości obrazu i renderowania tekstu na obrazie.

Prawdopodobnie najłatwiej skorzystamy z Flux w serwisie Nightcafe.studio. Po rejestracji możemy za darmo wygenerować kilka obrazów z komend tekstowych. Później konieczny jest abonament w wysokości od 5,99 dol./mc.

Czytaj też: Generujemy za dużo śmieci w kosmosie. Potrzebujemy śmieciarek na orbicie okołoziemskiej

Możliwości Flux w praktyce

Poniżej prezentujemy kilka możliwości Flux w praktyce.

791536feb807ca45ded2101bfd2b515e, Biznes Fakty
Praca "Graffiti astronaut" | Nessie Pasatiempo / Nightcafe
7aebd4b85db8113e821f5e0face394d3, Biznes Fakty
Praca "man with octopus head" | wildcard232 / Nightcafe
7bb1ac00cd78bdfa2accec321764de2c, Biznes Fakty
Praca "A bunny in space" | Anonymous User / Nightcafe
A4609a5b45600fc9ba9df64228d24b26, Biznes Fakty
Tenisistka | Mat. własne
E134635af4f1bab277c9fe7b3b014edb, Biznes Fakty
Praca "Bóg pączków" | mat. prasowe
90bca3a1102c08de0999e0ef58d61c34, Biznes Fakty
Tramwaj na mieście | mat. prasowe

Zespół Black Forest Labs poinformował, że pozyskał już finansowanie zalążkowe o wartości 31 mln dol. m.in. z udziałem popularnego funduszu venture capital Andreessen Horowitz. Teraz firma skupi się na dalszym rozwoju AI oraz prowadzi rekrutacje — szuka specjalistów ds. machine learningu i programistów backend.

Czytaj też: Aplikacje do rozbierania kobiet zyskują na popularności. To prawdziwa ciemna strona AI

Obrazy generowane w AI stają się coraz lepszej jakości. Niektóre z nich wyglądają jak prawdziwe — czyli przedstawiające prawdziwych ludzi, sfotografowanych przez innych ludzi. To oczywiście może być dużym utrudnieniem w dobie deep fake’ów i stanowi zagrożenie w kontekście cyberbezpieczeństwa. Jednocześnie ma też wiele zalet, np. autorzy powieści mogą w łatwy sposób obrazować konkretne sceny czy bohaterów, a rodzice mogą drukować bajki dla swoich dzieci. Sztuczna inteligencja po raz kolejny wywołuje efekt „wow”.

Autor: Grzegorz Kubera, dziennikarz Business Insider Polska

Dziękujemy, że przeczytałaś/eś nasz artykuł do końca. Bądź na bieżąco! Obserwuj nas w Wiadomościach Google.

Źródło

No votes yet.
Please wait...

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *