Biznes Fakty
ChatGPT z nową funkcją generowania i edycji grafiki. Zaskakujące efekty
ChatGPT zaprezentował nową funkcję tworzenia i edycji obrazów, obsługiwaną przez model GPT-4o. To ulepszenie znacznie rozszerza istniejące funkcjonalności platformy i zastępuje wcześniejszy model Dall-E 3.0. Nowa funkcja będzie dostępna dla użytkowników kont Plus i Pro, a w przyszłości planowane jest rozszerzenie jej dostępności na posiadaczy kont bezpłatnych. Tutaj przedstawiamy jej funkcje.

- ChatGPT zyskał nową możliwość tworzenia i edycji obrazów dzięki modelowi GPT-4o
- Zaktualizowane narzędzie umożliwia użytkownikom projektowanie niestandardowych grafik, w tym infografik, logotypów i komiksów, zachowując jednocześnie kontekst konwersacyjny
- GPT-4o ułatwia edycję istniejących obrazów i generowanie czytelnego tekstu w grafikach
- OpenAI wdraża środki bezpieczeństwa i kontrolę praw autorskich, chociaż narzędzie ma pewne ograniczenia
- Więcej szczegółów na temat biznesu znajdziesz na stronie Businessinsider.com.pl
Jak podaje OpenAI, nowa funkcja jest już dostępna dla abonentów planów Plus i Pro, a wkrótce będzie dostępna dla innych użytkowników, w tym posiadaczy bezpłatnych kont i deweloperów korzystających z API. Zapewnia to firmom zestaw narzędzi, które nie tylko ułatwiają konwersje językowe, ale także projektują i edytują materiały graficzne — od podstawowych infografik po złożone wizualizacje marketingowe.
W porównaniu z poprzednimi wersjami GPT-4o potrzebuje nieco więcej czasu na wygenerowanie obrazu — nawet do minuty — ale w zamian oferuje bardziej precyzyjne i dostosowane wyniki.
Godną uwagi zaletą jest integracja i spójność kontekstowa obrazów generowanych podczas interakcji z chatbotem. GPT-4o ma zdolność przywoływania poprzednich podpowiedzi i włączania ich do kolejnych dialogów. Pozwala to na ciągły rozwój pojedynczej koncepcji wizualnej, z możliwością ciągłych korekt.
Szczególną uwagę poświęcono możliwości generowania wyraźnego tekstu w obrazach . Stanowi to znaczący postęp w tworzeniu logo, map lub skomplikowanych diagramów i komiksów. Ta funkcja jest szczególnie atrakcyjna dla firm poszukujących szybkich, spójnych i łatwych do edycji rozwiązań graficznych.
GPT-4o może również modyfikować zdjęcia i wykonywać to, co jest znane jako inpainting. Co to oznacza? Wypełnianie luk lub wprowadzanie nowych elementów do istniejących obrazów , nawet jeśli przedstawiają ludzi.
Przeczytaj także: Jedno zdjęcie wystarczy, by stworzyć film: stabilność sztucznej inteligencji zmienia zasady w świecie wideo
OpenAI: Funkcja generowania obrazu jest bezpieczna
Jednocześnie OpenAI stawia bezpieczeństwo i ochronę praw autorskich na pierwszym miejscu. Zastosowany zestaw danych szkoleniowych — obejmujący zarówno publicznie dostępne zasoby, jak i partnerstwa komercyjne z firmami takimi jak Shutterstock — podlega odpowiednim regulacjom i nadzorowi.

Z jednej strony OpenAI oferuje twórcom możliwość wycofania konkretnych materiałów z bazy danych szkoleniowych, a z drugiej strony dba o to, aby model był wyposażony w zaawansowane mechanizmy zapobiegające naśladowaniu charakterystycznego stylu żyjących artystów lub polityków.
Wygenerowane obrazy zawierają również oznaczenia C2PA, które oznaczają, że zostały utworzone przy użyciu GPT-4o. Rozbudowana funkcja wyszukiwania wewnętrznego umożliwia identyfikację źródła poszczególnych grafik. Zmniejsza to ryzyko prawne i prawdopodobieństwo wprowadzenia użytkowników w błąd.
Ogromny potencjał nowej funkcji otwiera zastosowania biznesowe w niemal każdej branży, w której konieczne jest szybkie tworzenie i modyfikowanie materiałów graficznych.
Wyobraź sobie automatyczne tworzenie pokazów slajdów, projektowanie prototypowych opakowań produktów lub opracowywanie skomplikowanych infografik sprzedaży. GPT-4o zachowuje zrozumienie kontekstu biznesowego i może włączyć istotne elementy językowe lub symbole do obrazów.
Funkcje nowej AI wykraczają poza to. Analizując przesłane obrazy, użytkownicy mogą poprosić ChatGPT o przetworzenie obrazu, wyodrębnienie szczegółów i zaproponowanie wariacji stylistycznych.
Przeczytaj także: Lepszy niż wielu pracowników. ChatGPT od Deep Research budzi zarówno podziw, jak i obawy
Są też wady
Niemniej jednak nowe narzędzie nie jest pozbawione wad, ponieważ OpenAI komunikuje się szczerze. Model może generować tekst w obrazach, ale gdy chodzi o bardzo złożone lub „egzotyczne alfabety”, mogą pojawić się błędy i niespójności. GPT-4o może również czasami tworzyć nazwy i wprowadzać nieistniejące elementy , co jest szczególnie widoczne w przypadku mniej precyzyjnych poleceń.
Źródło