Sójka to ptak, który strzeże swego terytorium i wydaje głośne alarmy w obliczu zagrożenia. Takie ma być nowe narzędzie
Michał Duszczyk
Reklama
Mowa o Sójce. To projekt, za którym stoją twórcy modelu BielikAI. Co ciekawe, w tej inicjatywie może uczestniczyć każdy internauta, ponieważ, jak zapewniają przedstawiciele Bielika, aby wspierać rozwój polskiego AI, nie jest wymagana wyłącznie wiedza techniczna. Czym dokładnie jest Sójka? To model typu „guardrails”, zaprojektowany do analizy i moderacji treści, aby zapewnić, że systemy sztucznej inteligencji operują w ramach zasad etycznych i prawnych. Jego celem jest ochrona użytkowników dużych modeli językowych (LLM) przed szkodliwymi treściami.
Reklama
Ochrona przed nieodpowiednimi treściami
„Każdy z nas spotkał się w internecie z hejtem, wulgaryzmami, treściami o charakterze seksualnym, nawoływaniem do przemocy czy nawet aktami terrorystycznymi. To realny problem, który dotyka nas wszystkich, w tym nasze dzieci. Zdrowie psychiczne, szczególnie młodzieży, jest obecnie na krawędzi. Coraz więcej młodych ludzi poszukuje wsparcia w chatbotach, traktując je jak wirtualnych przyjaciół, z którymi mogą porozmawiać o wszystkim” – napisał na LinkedIn Jan Maria Kowalski, ekspert AI i współtwórca Bielika.
Jak wyjaśnia, Sójka ma być strażnikiem, chroniącym przed toksycznymi treściami, swoistym systemem wykrywania zagrożeń, wykorzystywanym na przykład do analizy czatów i wykrywania szkodliwych intencji w promptach (komendach dla botów), a także do weryfikacji odpowiedzi LLM-ów. Rozwiązanie to może być również stosowane do moderacji komentarzy w sieci, aby przeciwdziałać mowie nienawiści.
Jak internauci mogą wspierać budowę Sójki? Każdy może online wypełnić specjalną ankietę, która służy do szkolenia modelu. W praktyce polega to na starannym przeczytaniu przykładowego tekstu (promptu) i zaznaczeniu, czy treść powinna być zaklasyfikowana jako „nieetyczna”. Twórcy Sójki podkreślają, że ankieta jest w pełni anonimowa, a jej wypełnienie zajmuje zaledwie kilka sekund, przy czym – ze względu na pojawiające się treści (może zawierać m.in. wulgarne treści) – udział w ankiecie jest przeznaczony tylko dla dorosłych.
Reklama Reklama