
Google zaktualizował tryb rozumowania Deep Think w Gemini 3. Narzędzie jest pozycjonowane jako rozwiązanie złożonych problemów naukowych i inżynieryjnych.
W testach model uzyskał lepsze wyniki niż GPT-5.2 firmy OpenAI i Claude Opus 4.6 firmy Anthropic, w tym ARC-AGI-2 z łamigłówkami wizualnymi, MMMU-Pro do oceny możliwości multimodalnych, ELO 3455 i „Ostatni egzamin ludzkości”.

Źródło: Google.
„Zaktualizowaliśmy Gemini 3 Deep Think w ścisłej współpracy z naukowcami i badaczami, aby stawić czoła złożonym wyzwaniom naukowym, w których zadania często nie mają jasnych ram lub pojedynczego, poprawnego rozwiązania, a dane są niekompletne” – czytamy na blogu firmy.
Gemini 3 Deep Think wykazuje zaawansowane wyniki w matematyce i programowaniu, a także osiąga doskonałe wyniki w naukach przyrodniczych, w tym chemii i fizyce. Zaktualizowany tryb rozwiązuje zadania na poziomie złotych medalistów na międzynarodowych olimpiadach.
W teście CMT-Benchmark model uzyskał wynik 50,5%, co potwierdza jego dogłębną wiedzę w dziedzinie fizyki teoretycznej.

Źródło: Google.
„Oprócz zaawansowanej wydajności Deep Think koncentruje się na praktycznych zastosowaniach: pomaga badaczom interpretować złożone dane, a inżynierom modelować systemy fizyczne za pomocą kodu” – zauważa Google.
Nowa funkcja Deep Think jest dostępna w aplikacji Gemini dla subskrybentów usługi Google AI Ultra oraz w interfejsie API Gemini dla indywidualnych programistów.
Matematyk zajmujący się sztuczną inteligencją z DeepMind
Dział DeepMind firmy Google zaprezentował swojego agenta AI Aletheia. Model ten ustanowił nowy rekord w teście IMO-ProofBench Advanced, rozwiązując 91,9% zadań. Test ten jest uważany za jeden z najtrudniejszych w matematyce.
Sieć neuronowa zbudowana jest w oparciu o Gemini Deep Think. System wyposażony jest w moduł weryfikacji: wykrywa błędy w rozwiązaniach roboczych i uruchamia iteracyjny proces ich udoskonalania.
Podstawową cechą agenta jest umiejętność rozpoznania niemożności rozwiązania problemu, co znacznie oszczędza czas badaczy.
Aletheia korzysta z wyszukiwarki Google do nawigacji po skomplikowanych materiałach naukowych, zapobiegając możliwości korzystania z nieprawidłowych odniesień i błędów obliczeniowych podczas pracy z materiałami naukowymi.
Do osiągnięć modelki należą:
- pełne generowanie artykułu naukowego z obliczeniem stałych strukturalnych w geometrii arytmetycznej;
- wspólny dowód oszacowań dla układów oddziałujących cząstek (zestawów niezależnych) z człowiekiem;
- autonomiczne rozwiązanie czterech problemów z listy Erdősa, z których jeden był wcześniej uważany za otwarty.
DeepMind podkreślił, że sukces projektu Aletheia potwierdza trafność praw skalowania: w matematyce dowodowej jakość stale rośnie dzięki efektywnemu wykorzystaniu agentów.
Przełom w medycynie
Isomorphic Labs, spółka zależna firmy DeepMind, zaprezentowała swój silnik do opracowywania leków IsoDDE, który w złożonych testach dwukrotnie przewyższył AlphaFold 3.
To ostatnie było przełomem, ponieważ pozwoliło przewidzieć trójwymiarowe struktury białek i ich interakcje z cząsteczkami. Z kolei IsoDDE prezentuje zupełnie nowy poziom:
- model ten przewiduje siłę wiązania (powinowactwo) dokładniej niż tradycyjne metody;
- sterownik może wykryć ukryte struktury („kieszenie”) białek, w których lek może się wiązać;
- Obsługiwana jest szeroka gama złożonych cząsteczek, w tym przeciwciała i duże struktury biologiczne.
„IsoDDE oferuje skalowalną platformę do projektowania leków z wykorzystaniem sztucznej inteligencji, zapewniającą dokładność predykcyjną potrzebną do projektowania nowych systemów biologicznych z niespotykaną dotąd pewnością” – czytamy na blogu firmy.
Przypomnijmy, że w styczniu lekarze pozytywnie zareagowali na uruchomienie aplikacji ChatGPT Health służącej do konsultacji zdrowotnych.
