Czytasz teraz
Zdjęcia w stylu studia Ghibli robią furorę w sieci. Użycie filtru rodzi jednak wątpliwości
Opinie

Zdjęcia w stylu studia Ghibli robią furorę w sieci. Użycie filtru rodzi jednak wątpliwości

Studio Ghibli filtr

Narzędzie wprowadzone w ramach aktualizacji GPT-4o jest szybkie, skuteczne i gwarantuje miłą pamiątkę. W czym zatem tkwi problem?

OpenAI, lider na rynku rozwoju sztucznej inteligencji, w pocie czoła rozwija kolejne funkcjonalności. Na początku tygodnia wprowadził kolejną aktualizację modelu GPT-4o. Tym razem ucieszą się z niej przede wszystkim ci, którzy wykorzystują narzędzie do generowania obrazów. Główna zmiana dotyczy treści służących wizualnemu przekazywaniu informacji.

Tekst na obrazie? Żaden problem!

Dzisiejsze modele generatywne potrafią wyczarować surrealistyczne, zapierające dech w piersiach sceny, ale mają problem z materiałami roboczymi, od logo po diagramy. Tymczasem takowe precyzyjnie przekazują znaczenie, gdy są wzbogacane o symbole odnoszące się do wspólnego języka czy doświadczenia – przeczytamy w komunikacie prasowym. Mając to na uwagę, podjęto decyzję o gruntownej modyfikacji ich tworzenia. Takie usprawnienie obrodzi w dokładniejsze infografiki, diagramy, drogowskazy albo restauracyjne menu. Zawarte w nich teksty są wyraźne i pozbawione błędów, inaczej niż do tej pory.

Text Rendering with 4o Image Generation

GPT-4o wierniej realizuje także złożone polecenia, generując obrazy w czasie rzeczywistym. Aby były jeszcze dokładniejsze, samodzielnie wykorzystuje przyswojoną wcześniej wiedzę. Nie trzeba podawać mu instrukcji przyrządzania kawy albo matchy, żeby zwizualizował ją w przystępny sposób. Problemu nie sprawia mu także łączenie ze sobą różnych elementów, nawet jeśli są utrzymane w zupełnie innej kolorystyce albo stylu.

Detailed Directions with 4o Image Generation

Jeszcze prostsze przeróbki

Najszerzej po sieci poniosło się jednak demonstrowanie jeszcze jednej funkcjonalności. Chodzi o usprawniony proces modyfikacji istniejących zdjęć. Fotorealistyczna fotografia może szybko stać się abstrakcjonistycznym malowidłem, nowoczesnym kolażem albo rysunkiem. Elementy zawarte na wygenerowanych obrazach bezpośrednio odnoszą się do promptów. Jednocześnie spada ryzyko halucynacji, na przykład sześciu palców u jednej ręki.

Studio Ghibli filtr
Obraz astronauty malującego galaktykę spiralną został wygenerowany przy użyciu modelu GPT-4o / OpenAI / materiały prasowe

Studio Ghibli: prompt imitujący animatorów

Internauci szybko zechcieli sprawdzić, jak GPT-4o radzi sobie z najrozmaitszymi stylami. Szczególnie chętnie wpisywali prompt zlecający stworzenie czegoś, co będzie naśladować styl Studia Ghibli. Estetyka wytwórni, która dała światu Księżniczkę Mononoke, Mojego sąsiada Totoro albo Grobowiec świetlików, faktycznie stanowi dobry papierek lakmusowy. Już po jednym kadrze łatwo rozpoznać, że miękka kreska, postacie o łagodnym usposobieniu czy miękkie, pastelowe barwy to robota Japończyków. Okazuje się, że AI zaskakująco dobrze odwzorowuje te cechy. Spójrzcie zresztą sami: Hayao Miyazaki spokojnie mógłby się pod nimi podpisać…

Studio Ghibli: Filtr nakładany przez użytkowników GPT-4o cieszy się dużą popularnością / X / @Discobanker
Studio Ghibli: Filtr nakładany przez użytkowników GPT-4o cieszy się dużą popularnością / X / @WeAreNearYou
Studio Ghibli: Filtr nakładany przez użytkowników GPT-4o cieszy się dużą popularnością / X / @whostanvir

Obraza dla ludzkiej kreatywności i przeszkody prawne

… tyle że by raczej nie chciał. Słynny animator już w 2016 roku, gdy generatywna AI dopiero zaczynała kiełkować, przestrzegał przed jej użyciem. Narzędzie nazywał wprost obrazą dla życia samego w sobie. – Jako ludzie tracimy wiarę w siebie. Jestem naprawdę zniesmaczony. Jeśli chcesz tworzyć takie przerażające rzeczy, możesz to robić, ale nie chciałbym włączać tej technologii do swojej pracy tłumaczył gronu programistów.

Inną kwestią, która może powstrzymywać przed zabawą GPT-4o, jest zaś fakt potencjalnego naruszenia praw autorskich. OpenAI narusza własność intelektualną artystów, wykorzystując materiały, dzięki którym generuje dokładniejsze obrazy. Co prawda aktualizacja narzędzia zakłada odmowę w przypadku prośby o imitację dzieła konkretnej osoby, ale reguła ta najwyraźniej nie stosuje się w przypadku większych zjawisk albo wytwórni.

Studio Ghibli nie odniosło się jeszcze do nowinek OpenAI.

Prof. Andrzej Dragan, Krzysztof Hołowczyc, Piotr Konieczny. Kogo jeszcze zobaczymy na lubelskiej konferencji IT Unplugged?

Copyright © Going. 2024 • Wszelkie prawa zastrzeżone

Do góry strony