
Firma OpenAI wydała „myślący” generator obrazów ChatGPT Images 2.0 — „zaawansowany model, który potrafi rozwiązywać złożone zadania wizualne i tworzyć dokładne, gotowe do użycia prace”.
Przedstawiamy obrazy ChatGPT 2.0
Zaawansowany model obrazowania, który realizuje złożone zadania wizualne i tworzy dokładne, gotowe do użycia wizualizacje z bardziej precyzyjną edycją, bogatszymi układami i inteligencją „myślenia”.
Film stworzony za pomocą ChatGPT Images pic.twitter.com/3aWfXakrcR
— OpenAI (@OpenAI) 21 kwietnia 2026 r
Firma odnotowała „jakościowy skok” w przestrzeganiu instrukcji, dokładnym rozmieszczeniu i proporcjach obiektów, a także w wizualizacji gęstego tekstu.
Model ten sprawnie działa w wielu językach i samodzielnie uzupełnia luki w zapytaniu, opierając się na kontekście wizualnym i ogólnym. W rezultacie użytkownik otrzymuje pożądany wynik z mniejszą liczbą wyjaśnień.
Precyzja i kontrola
ChatGPT Images 2.0 to narzędzie, które przekształca złożone koncepcje w precyzyjne wizualne ucieleśnienie.
Model wykonuje polecenia, zachowuje określone szczegóły i odtwarza małe elementy w rozdzielczości do 2K.
Większa precyzja i kontrola
ChatGPT Images 2.0 pozwala tworzyć bardziej złożone obrazy, a następnie skutecznie wcielić tę wizję w życie.
Potrafi wykonywać instrukcje, zachowywać żądane szczegóły i renderować małe elementy, które często „psują” obrazy… pic.twitter.com/n29165pV9Q
— OpenAI (@OpenAI) 21 kwietnia 2026 r
Praca ze stylami
ChatGPT Images 2.0 precyzyjniej oddaje cechy fotografii, klatek filmowych, grafiki pikselowej, mangi i innych stylów wizualnych. LLM zapewnia wysoką spójność tekstur, oświetlenia, kompozycji i drobnych detali.
Taka precyzja okaże się przydatna przy tworzeniu prototypów gier, opracowywaniu storyboardów , przygotowywaniu materiałów marketingowych i tworzeniu dzieł w określonym formacie medialnym lub gatunku.
Potrafić myśleć
ChatGPT Images 2.0 to pierwszy model obrazu firmy OpenAI, który potrafi myśleć jeszcze przed generacją.
Współpracując z ChatGPT, model ten potrafi wyszukiwać informacje w Internecie w czasie rzeczywistym, tworzyć wiele opcji dla jednego komunikatu, weryfikować wyniki i generować działające kody QR.
„Dzięki temu model może przejąć większość ciężaru współpracy między pomysłem a obrazem, zwłaszcza gdy najważniejsze są dokładność, trafność, spójność i integralność wizualna” – twierdzi OpenAI.
Model obsługuje proporcje obrazu od 3:1 (szerokość) do 1:3 (wysokość). Jest dostępny dla użytkowników ChatGPT i Codex.
Funkcja „Obrazy z myśleniem” jest dostępna w planach ChatGPT Plus, Pro i Business.
Przypomnijmy, że w kwietniu OpenAI udostępniło ograniczonej liczbie użytkowników nowy model sztucznej inteligencji GPT-5.4-Cyber.
