Opinie

Zdjęcia w stylu studia Ghibli robią furorę w sieci. Użycie filtru rodzi jednak wątpliwości

GPT-4o

Redaktor naczelny Going. MORE. Publikował lub publikuje także na łamach…

Narzędzie wprowadzone w ramach aktualizacji GPT-4o jest szybkie, skuteczne i gwarantuje miłą pamiątkę. W czym zatem tkwi problem?

OpenAI, lider na rynku rozwoju sztucznej inteligencji, w pocie czoła rozwija kolejne funkcjonalności. Na początku tygodnia wprowadził kolejną aktualizację modelu GPT-4o. Tym razem ucieszą się z niej przede wszystkim ci, którzy wykorzystują narzędzie do generowania obrazów. Główna zmiana dotyczy treści służących wizualnemu przekazywaniu informacji.

Tekst na obrazie? Żaden problem!

– Dzisiejsze modele generatywne potrafią wyczarować surrealistyczne, zapierające dech w piersiach sceny, ale mają problem z materiałami roboczymi, od logo po diagramy. Tymczasem takowe precyzyjnie przekazują znaczenie, gdy są wzbogacane o symbole odnoszące się do wspólnego języka czy doświadczenia – przeczytamy w komunikacie prasowym. Mając to na uwagę, podjęto decyzję o gruntownej modyfikacji ich tworzenia. Takie usprawnienie obrodzi w dokładniejsze infografiki, diagramy, drogowskazy albo restauracyjne menu. Zawarte w nich teksty są wyraźne i pozbawione błędów, inaczej niż do tej pory.

^{Text Rendering with 4o Image Generation}

GPT-4o wierniej realizuje także złożone polecenia, generując obrazy w czasie rzeczywistym. Aby były jeszcze dokładniejsze, samodzielnie wykorzystuje przyswojoną wcześniej wiedzę. Nie trzeba podawać mu instrukcji przyrządzania kawy albo matchy, żeby zwizualizował ją w przystępny sposób. Problemu nie sprawia mu także łączenie ze sobą różnych elementów, nawet jeśli są utrzymane w zupełnie innej kolorystyce albo stylu.

^{Detailed Directions with 4o Image Generation}

Jeszcze prostsze przeróbki

Najszerzej po sieci poniosło się jednak demonstrowanie jeszcze jednej funkcjonalności. Chodzi o usprawniony proces modyfikacji istniejących zdjęć. Fotorealistyczna fotografia może szybko stać się abstrakcjonistycznym malowidłem, nowoczesnym kolażem albo rysunkiem. Elementy zawarte na wygenerowanych obrazach bezpośrednio odnoszą się do promptów. Jednocześnie spada ryzyko halucynacji, na przykład sześciu palców u jednej ręki.

Studio Ghibli: prompt imitujący animatorów

Internauci szybko zechcieli sprawdzić, jak GPT-4o radzi sobie z najrozmaitszymi stylami. Szczególnie chętnie wpisywali prompt zlecający stworzenie czegoś, co będzie naśladować styl Studia Ghibli. Estetyka wytwórni, która dała światu Księżniczkę Mononoke, Mojego sąsiada Totoro albo Grobowiec świetlików, faktycznie stanowi dobry papierek lakmusowy. Już po jednym kadrze łatwo rozpoznać, że miękka kreska, postacie o łagodnym usposobieniu czy miękkie, pastelowe barwy to robota Japończyków. Okazuje się, że AI zaskakująco dobrze odwzorowuje te cechy. Spójrzcie zresztą sami: Hayao Miyazaki spokojnie mógłby się pod nimi podpisać…

Me waiting for a Ghibli prompt to finally work between timed-out requests and system errors pic.twitter.com/GqX9vg7Sbw
— Disco Central Banker (@Discobanker) March 26, 2025

^{Studio Ghibli: Filtr nakładany przez użytkowników GPT-4o cieszy się dużą popularnością / X / @Discobanker}

🔥It's been 24 hours since #OpenAI unexpectedly shook the #AI image world with 4o image generation.

Here are examples so far (100% AI-generated):

Studio #ghibli style memes

Just go to #ChatGPT and enable gpt 5.4 and type prompt “Make this ghibli anime style” pic.twitter.com/PSrSJn4Xjl
— ꧁𝐒𝐨𝐫𝐨𝐮𝐬𝐡꧂ (@WeAreNearYou) March 27, 2025

^{Studio Ghibli: Filtr nakładany przez użytkowników GPT-4o cieszy się dużą popularnością / X / @WeAreNearYou}

Światowy Dzień Świadomości Autyzmu — ^{Studio Ghibli: Filtr nakładany przez użytkowników GPT-4o cieszy się dużą popularnością / X / @whostanvir}

Obraza dla ludzkiej kreatywności i przeszkody prawne

… tyle że by raczej nie chciał. Słynny animator już w 2016 roku, gdy generatywna AI dopiero zaczynała kiełkować, przestrzegał przed jej użyciem. Narzędzie nazywał wprost obrazą dla życia samego w sobie. – Jako ludzie tracimy wiarę w siebie. Jestem naprawdę zniesmaczony. Jeśli chcesz tworzyć takie przerażające rzeczy, możesz to robić, ale nie chciałbym włączać tej technologii do swojej pracy – tłumaczył gronu programistów.

Inną kwestią, która może powstrzymywać przed zabawą GPT-4o, jest zaś fakt potencjalnego naruszenia praw autorskich. OpenAI narusza własność intelektualną artystów, wykorzystując materiały, dzięki którym generuje dokładniejsze obrazy. Co prawda aktualizacja narzędzia zakłada odmowę w przypadku prośby o imitację dzieła konkretnej osoby, ale reguła ta najwyraźniej nie stosuje się w przypadku większych zjawisk albo wytwórni.

Studio Ghibli nie odniosło się jeszcze do nowinek OpenAI.

Prof. Andrzej Dragan, Krzysztof Hołowczyc, Piotr Konieczny. Kogo jeszcze zobaczymy na lubelskiej konferencji IT Unplugged?

Tagi

animacja MORE News Społeczeństwo technologia

Stanisław Bryś

Redaktor naczelny Going. MORE. Publikował lub publikuje także na łamach „newonce", „NOIZZ", „Czasopisma Ekrany", „Magazynu Kontakt", „Gazety Magnetofonowej" czy „Papaya.Rocks". Mieszka i pracuje w Warszawie.