Google zaprezentowało sieć neuronową Nano Banana 2

Google zaprezentowało sieć neuronową Nano Banana 2 2

Google wprowadziło Nano Banana 2, nowy model aparatu fotograficznego, który działa z prędkością Gemini Flash.

Produkt wykorzystuje bazę wiedzy Gemini i dane z wyszukiwania w Internecie w czasie rzeczywistym, aby dokładniej przedstawiać złożone obiekty, generować infografiki i przekształcać notatki tekstowe w diagramy wizualne.

Nano Banana 2 może również generować przejrzysty i czytelny tekst na obrazach, od makiet marketingowych po pocztówki. Wbudowana lokalizacja pozwala dostosować tekst do potrzeb dowolnej grupy odbiorców.

obraz

Infografika cyklu wodnego wygenerowana przez Nano Banana 2. Źródło: Google.

Model tworzy szczegółowe, fotorealistyczne obrazy bez utraty szybkości. Kluczowe różnice między Nano Banana 2 a poprzednią wersją:

  • spójność obiektów: sieć neuronowa zachowuje wygląd do pięciu znaków i dokładność 14 obiektów w ramach jednego projektu;
  • dokładność wykonania: system lepiej rozumie złożone komunikaty tekstowe i bierze pod uwagę drobne niuanse, ściśle realizując żądania użytkownika;
  • Elastyczność formatu: pełna kontrola nad proporcjami obrazu i rozdzielczością od 512 px do 4K — od postów pionowych do ekranów panoramicznych;
  • Jakość wizualna: jasne oświetlenie, bogate tekstury i ostre szczegóły przy jednoczesnym zachowaniu szybkości charakterystycznej dla linii Flash.

Nano Banana 2 zastąpi wersję Pro w modelach Fast, Thinking i Pro aplikacji Gemini. Subskrybenci Google AI Pro i Ultra zachowają dostęp do Nano Banana Pro.

Model jest zintegrowany z wyszukiwarką Google (w trybach AI i Lens) i jest dostępny w wersji przedpremierowej w AI Studio i Gemini API.

Aktualizacja przepływu

Google wprowadziło również zaktualizowaną wersję swojej usługi generowania wideo Flow. Deweloperzy całkowicie przeprojektowali interfejs, łącząc funkcje generowania obrazu i wideo w jednym obszarze roboczym.

Flow zintegrował najlepsze funkcje z platform eksperymentalnych Whisk i ImageFX. Nano Banana 2 stał się częścią podstawowej funkcjonalności. Teraz użytkownicy mogą tworzyć obrazy i wykorzystywać je jako klatki do generowania wideo bez opuszczania usługi.

Nowa siatka zasobów ułatwia wyszukiwanie, filtrowanie i sortowanie obrazów i filmów oraz grupowanie ich w kolekcje. Narzędzie Lasso pozwala precyzyjnie zaznaczyć obszar obrazu i wprowadzić zmiany za pomocą komunikatów tekstowych – takich jak „usuń osobę” lub „dodaj koi do wody”. Możesz również rysować bezpośrednio na obrazach, aby zaznaczyć zmiany.

Według firmy, od momentu uruchomienia usługi użytkownicy Flow stworzyli ponad 1,5 miliarda obrazów i filmów na potrzeby projektów kreatywnych, w tym filmów, teledysków i kampanii reklamowych.

Przypomnijmy, że w lutym Google wprowadziło Gemini 3.1 Pro i zaktualizowało narzędzie AI do kodowania wibracji Opal.

No votes yet.
Please wait...

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *