OpenAI prezentuje „myślący” generator obrazów ChatGPT Images 2.0

Firma OpenAI wydała „myślący” generator obrazów ChatGPT Images 2.0 — „zaawansowany model, który potrafi rozwiązywać złożone zadania wizualne i tworzyć dokładne, gotowe do użycia prace”.

Przedstawiamy obrazy ChatGPT 2.0

Zaawansowany model obrazowania, który realizuje złożone zadania wizualne i tworzy dokładne, gotowe do użycia wizualizacje z bardziej precyzyjną edycją, bogatszymi układami i inteligencją „myślenia”.

Film stworzony za pomocą ChatGPT Images pic.twitter.com/3aWfXakrcR

— OpenAI (@OpenAI) 21 kwietnia 2026 r

Firma odnotowała „jakościowy skok” w przestrzeganiu instrukcji, dokładnym rozmieszczeniu i proporcjach obiektów, a także w wizualizacji gęstego tekstu.

Model ten sprawnie działa w wielu językach i samodzielnie uzupełnia luki w zapytaniu, opierając się na kontekście wizualnym i ogólnym. W rezultacie użytkownik otrzymuje pożądany wynik z mniejszą liczbą wyjaśnień.

Precyzja i kontrola

ChatGPT Images 2.0 to narzędzie, które przekształca złożone koncepcje w precyzyjne wizualne ucieleśnienie.

Model wykonuje polecenia, zachowuje określone szczegóły i odtwarza małe elementy w rozdzielczości do 2K.

Większa precyzja i kontrola

ChatGPT Images 2.0 pozwala tworzyć bardziej złożone obrazy, a następnie skutecznie wcielić tę wizję w życie.

Potrafi wykonywać instrukcje, zachowywać żądane szczegóły i renderować małe elementy, które często „psują” obrazy… pic.twitter.com/n29165pV9Q

— OpenAI (@OpenAI) 21 kwietnia 2026 r

Praca ze stylami

ChatGPT Images 2.0 precyzyjniej oddaje cechy fotografii, klatek filmowych, grafiki pikselowej, mangi i innych stylów wizualnych. LLM zapewnia wysoką spójność tekstur, oświetlenia, kompozycji i drobnych detali.

Taka precyzja okaże się przydatna przy tworzeniu prototypów gier, opracowywaniu storyboardów , przygotowywaniu materiałów marketingowych i tworzeniu dzieł w określonym formacie medialnym lub gatunku.

Potrafić myśleć

ChatGPT Images 2.0 to pierwszy model obrazu firmy OpenAI, który potrafi myśleć jeszcze przed generacją.

Współpracując z ChatGPT, model ten potrafi wyszukiwać informacje w Internecie w czasie rzeczywistym, tworzyć wiele opcji dla jednego komunikatu, weryfikować wyniki i generować działające kody QR.

„Dzięki temu model może przejąć większość ciężaru współpracy między pomysłem a obrazem, zwłaszcza gdy najważniejsze są dokładność, trafność, spójność i integralność wizualna” – twierdzi OpenAI.

Model obsługuje proporcje obrazu od 3:1 (szerokość) do 1:3 (wysokość). Jest dostępny dla użytkowników ChatGPT i Codex.

Funkcja „Obrazy z myśleniem” jest dostępna w planach ChatGPT Plus, Pro i Business.

Przypomnijmy, że w kwietniu OpenAI udostępniło ograniczonej liczbie użytkowników nowy model sztucznej inteligencji GPT-5.4-Cyber.

No votes yet.

Please wait...

Precyzja i kontrola

Praca ze stylami

Potrafić myśleć

Dodaj komentarzAnuluj odpowiedź