Aktualizacja Google AI: Gemini Deep Think, matematyk AI i silnik rozwoju leków

Google zaktualizował tryb rozumowania Deep Think w Gemini 3. Narzędzie jest pozycjonowane jako rozwiązanie złożonych problemów naukowych i inżynieryjnych.

W testach model uzyskał lepsze wyniki niż GPT-5.2 firmy OpenAI i Claude Opus 4.6 firmy Anthropic, w tym ARC-AGI-2 z łamigłówkami wizualnymi, MMMU-Pro do oceny możliwości multimodalnych, ELO 3455 i „Ostatni egzamin ludzkości”.

obraz

Źródło: Google.

„Zaktualizowaliśmy Gemini 3 Deep Think w ścisłej współpracy z naukowcami i badaczami, aby stawić czoła złożonym wyzwaniom naukowym, w których zadania często nie mają jasnych ram lub pojedynczego, poprawnego rozwiązania, a dane są niekompletne” – czytamy na blogu firmy.

Gemini 3 Deep Think wykazuje zaawansowane wyniki w matematyce i programowaniu, a także osiąga doskonałe wyniki w naukach przyrodniczych, w tym chemii i fizyce. Zaktualizowany tryb rozwiązuje zadania na poziomie złotych medalistów na międzynarodowych olimpiadach.

W teście CMT-Benchmark model uzyskał wynik 50,5%, co potwierdza jego dogłębną wiedzę w dziedzinie fizyki teoretycznej.

obraz

Źródło: Google.

„Oprócz zaawansowanej wydajności Deep Think koncentruje się na praktycznych zastosowaniach: pomaga badaczom interpretować złożone dane, a inżynierom modelować systemy fizyczne za pomocą kodu” – zauważa Google.

Nowa funkcja Deep Think jest dostępna w aplikacji Gemini dla subskrybentów usługi Google AI Ultra oraz w interfejsie API Gemini dla indywidualnych programistów.

Matematyk zajmujący się sztuczną inteligencją z DeepMind

Dział DeepMind firmy Google zaprezentował swojego agenta AI Aletheia. Model ten ustanowił nowy rekord w teście IMO-ProofBench Advanced, rozwiązując 91,9% zadań. Test ten jest uważany za jeden z najtrudniejszych w matematyce.

Sieć neuronowa zbudowana jest w oparciu o Gemini Deep Think. System wyposażony jest w moduł weryfikacji: wykrywa błędy w rozwiązaniach roboczych i uruchamia iteracyjny proces ich udoskonalania.

Podstawową cechą agenta jest umiejętność rozpoznania niemożności rozwiązania problemu, co znacznie oszczędza czas badaczy.

Aletheia korzysta z wyszukiwarki Google do nawigacji po skomplikowanych materiałach naukowych, zapobiegając możliwości korzystania z nieprawidłowych odniesień i błędów obliczeniowych podczas pracy z materiałami naukowymi.

Do osiągnięć modelki należą:

  • pełne generowanie artykułu naukowego z obliczeniem stałych strukturalnych w geometrii arytmetycznej;
  • wspólny dowód oszacowań dla układów oddziałujących cząstek (zestawów niezależnych) z człowiekiem;
  • autonomiczne rozwiązanie czterech problemów z listy Erdősa, z których jeden był wcześniej uważany za otwarty.

DeepMind podkreślił, że sukces projektu Aletheia potwierdza trafność praw skalowania: w matematyce dowodowej jakość stale rośnie dzięki efektywnemu wykorzystaniu agentów.

Przełom w medycynie

Isomorphic Labs, spółka zależna firmy DeepMind, zaprezentowała swój silnik do opracowywania leków IsoDDE, który w złożonych testach dwukrotnie przewyższył AlphaFold 3.

To ostatnie było przełomem, ponieważ pozwoliło przewidzieć trójwymiarowe struktury białek i ich interakcje z cząsteczkami. Z kolei IsoDDE prezentuje zupełnie nowy poziom:

  • model ten przewiduje siłę wiązania (powinowactwo) dokładniej niż tradycyjne metody;
  • sterownik może wykryć ukryte struktury („kieszenie”) białek, w których lek może się wiązać;
  • Obsługiwana jest szeroka gama złożonych cząsteczek, w tym przeciwciała i duże struktury biologiczne.

„IsoDDE oferuje skalowalną platformę do projektowania leków z wykorzystaniem sztucznej inteligencji, zapewniającą dokładność predykcyjną potrzebną do projektowania nowych systemów biologicznych z niespotykaną dotąd pewnością” – czytamy na blogu firmy.

Przypomnijmy, że w styczniu lekarze pozytywnie zareagowali na uruchomienie aplikacji ChatGPT Health służącej do konsultacji zdrowotnych.

No votes yet.
Please wait...

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *