ChatGPT z nową funkcją generowania i edycji grafiki. Zaskakujące efekty

ChatGPT zaprezentował nową funkcję tworzenia i edycji obrazów, obsługiwaną przez model GPT-4o. To ulepszenie znacznie rozszerza istniejące funkcjonalności platformy i zastępuje wcześniejszy model Dall-E 3.0. Nowa funkcja będzie dostępna dla użytkowników kont Plus i Pro, a w przyszłości planowane jest rozszerzenie jej dostępności na posiadaczy kont bezpłatnych. Tutaj przedstawiamy jej funkcje.

B2ed098576f5f726f7f7f9b355700a8e, Biznes Fakty
Generowanie i edycja obrazów są znacznie łatwiejsze w najnowszej wersji ChatGPT (obraz podglądu) | Zdjęcie: Domenico Fornas / Shutterstock
  • ChatGPT zyskał nową możliwość tworzenia i edycji obrazów dzięki modelowi GPT-4o
  • Zaktualizowane narzędzie umożliwia użytkownikom projektowanie niestandardowych grafik, w tym infografik, logotypów i komiksów, zachowując jednocześnie kontekst konwersacyjny
  • GPT-4o ułatwia edycję istniejących obrazów i generowanie czytelnego tekstu w grafikach
  • OpenAI wdraża środki bezpieczeństwa i kontrolę praw autorskich, chociaż narzędzie ma pewne ograniczenia
  • Więcej szczegółów na temat biznesu znajdziesz na stronie Businessinsider.com.pl

Jak podaje OpenAI, nowa funkcja jest już dostępna dla abonentów planów Plus i Pro, a wkrótce będzie dostępna dla innych użytkowników, w tym posiadaczy bezpłatnych kont i deweloperów korzystających z API. Zapewnia to firmom zestaw narzędzi, które nie tylko ułatwiają konwersje językowe, ale także projektują i edytują materiały graficzne — od podstawowych infografik po złożone wizualizacje marketingowe.

W porównaniu z poprzednimi wersjami GPT-4o potrzebuje nieco więcej czasu na wygenerowanie obrazu — nawet do minuty — ale w zamian oferuje bardziej precyzyjne i dostosowane wyniki.

Godną uwagi zaletą jest integracja i spójność kontekstowa obrazów generowanych podczas interakcji z chatbotem. GPT-4o ma zdolność przywoływania poprzednich podpowiedzi i włączania ich do kolejnych dialogów. Pozwala to na ciągły rozwój pojedynczej koncepcji wizualnej, z możliwością ciągłych korekt.

Szczególną uwagę poświęcono możliwości generowania wyraźnego tekstu w obrazach . Stanowi to znaczący postęp w tworzeniu logo, map lub skomplikowanych diagramów i komiksów. Ta funkcja jest szczególnie atrakcyjna dla firm poszukujących szybkich, spójnych i łatwych do edycji rozwiązań graficznych.

GPT-4o może również modyfikować zdjęcia i wykonywać to, co jest znane jako inpainting. Co to oznacza? Wypełnianie luk lub wprowadzanie nowych elementów do istniejących obrazów , nawet jeśli przedstawiają ludzi.

Przeczytaj także: Jedno zdjęcie wystarczy, by stworzyć film: stabilność sztucznej inteligencji zmienia zasady w świecie wideo

OpenAI: Funkcja generowania obrazu jest bezpieczna

Jednocześnie OpenAI stawia bezpieczeństwo i ochronę praw autorskich na pierwszym miejscu. Zastosowany zestaw danych szkoleniowych — obejmujący zarówno publicznie dostępne zasoby, jak i partnerstwa komercyjne z firmami takimi jak Shutterstock — podlega odpowiednim regulacjom i nadzorowi.

755b14162d7aa1606ac2a4c13a876a58, Biznes Fakty
Przykładowy obraz wygenerowany przez ChatGPT | OpenAI

Z jednej strony OpenAI oferuje twórcom możliwość wycofania konkretnych materiałów z bazy danych szkoleniowych, a z drugiej strony dba o to, aby model był wyposażony w zaawansowane mechanizmy zapobiegające naśladowaniu charakterystycznego stylu żyjących artystów lub polityków.

Wygenerowane obrazy zawierają również oznaczenia C2PA, które oznaczają, że zostały utworzone przy użyciu GPT-4o. Rozbudowana funkcja wyszukiwania wewnętrznego umożliwia identyfikację źródła poszczególnych grafik. Zmniejsza to ryzyko prawne i prawdopodobieństwo wprowadzenia użytkowników w błąd.

Ogromny potencjał nowej funkcji otwiera zastosowania biznesowe w niemal każdej branży, w której konieczne jest szybkie tworzenie i modyfikowanie materiałów graficznych.

Wyobraź sobie automatyczne tworzenie pokazów slajdów, projektowanie prototypowych opakowań produktów lub opracowywanie skomplikowanych infografik sprzedaży. GPT-4o zachowuje zrozumienie kontekstu biznesowego i może włączyć istotne elementy językowe lub symbole do obrazów.

Funkcje nowej AI wykraczają poza to. Analizując przesłane obrazy, użytkownicy mogą poprosić ChatGPT o przetworzenie obrazu, wyodrębnienie szczegółów i zaproponowanie wariacji stylistycznych.

Przeczytaj także: Lepszy niż wielu pracowników. ChatGPT od Deep Research budzi zarówno podziw, jak i obawy

Są też wady

Niemniej jednak nowe narzędzie nie jest pozbawione wad, ponieważ OpenAI komunikuje się szczerze. Model może generować tekst w obrazach, ale gdy chodzi o bardzo złożone lub „egzotyczne alfabety”, mogą pojawić się błędy i niespójności. GPT-4o może również czasami tworzyć nazwy i wprowadzać nieistniejące elementy , co jest szczególnie widoczne w przypadku mniej precyzyjnych poleceń.


Źródło
No votes yet.
Please wait...

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *