Nowe ChatGPT kłamią jak najęte. Halucynacje w co drugiej odpowiedzi

Najnowsze modele sztucznej inteligencji OpenAI do wnioskowania udzielają częściej fałszywych odpowiedzi od starszych AI. Nie wiadomo dlaczego.
Ai klamie fot. ChatGPT/AI
mkk

Kilka dni temu, o czym pisaliśmy, OpenAI udostępniła nowe modele do wnioskowania – w tym najważniejsze o3 i o4-mini. Lepiej od poprzedników radzą sobie w niektórych obszarach – szczególnie kodowania i matematyki. Teraz okazało się, że niestety dużo częściej od starszych modeli OpenAI zmyślają odpowiedzi. Mają halucynacje w większej wyraźnie liczbie niż poprzednie modele rozumowania firmy — o1, o1-mini i o3-mini — a także tradycyjne, "nierozumujące” modele OpenAI, takie jak GPT-4o.

Współczynnik odpowiedzi udzielanych przez nowe modele z fałszywymi treściami jest niepokojąco wysoki. Firma OpenAI odkryła, że ​​o3 wykazywał halucynacje w odpowiedzi na aż 33 proc. pytań. To wynik osiągnięty w specjalnym narzędziu PersonQA wykorzystywanym przez OpenAI.do pomiaru dokładności wiedzy modelu.

Bydgoszcz: 3 mężczyzn zatrzymanych po nocnych wybrykach na hulajnodze

33 proc. odpowiedzi z halucynacjami to mniej więcej dwa razy więcej niż wynosi wskaźnik halucynacji w przypadku poprzednich modeli rozumowania OpenAI – o1 i o3-mini. Te uzyskują tutaj w testach odpowiednio wyniki 16 proc. i 14,8 proc. O4-mini wypadł w teście PersonQA jeszcze gorzej. W jego wypadku halucynacje występowały aż w 48 proc. przypadków.

To, że nowe modele do wnioskowania częściej kłamią zauważyło też laboratorium Transluce, specjalizujące się w badaniach nad sztuczną inteligencją. Jego badacze zauważyli np. jak o3 poinformował użytkownika, że uruchomił kod na MacBooku Pro z 2021 r. "poza ChatGPT”, a następnie skopiował liczby do swojej odpowiedzi. To fikcja, o3 nie może tego zrobić.

Są też informacje o tym, że w kodach aplikacji wygenerowanych przez nowe modele pojawiają się np. odnośniki do nieistniejących stron WWW.

Nikt nie wie, dlaczego się tak dzieje. Transluce w rozmowie z serwisem TechCrunch spekuluje, że wzrost liczby halucynacji nowych modeli należy łączyć z techniką ich uczenia poprzez tzw. wzmacnianie. W niej nie tylko rosną ich możliwości, ale wzmacniane są i ich największe słabości. 

Wydaje się więc, że teraz branża AI weszła trochę w ślepą uliczkę. W zeszłym roku skupiła się na rozwoju modeli wnioskowania po tym, jak techniki ulepszania tradycyjnych modeli AI zaczęły wykazywać malejącą skuteczność. Rozumowanie wydawało się, że pozwala zwiększyć wydajność modelu w przypadku wielu zadań, bez konieczności przeprowadzania ogromnych obliczeń i wykorzystywania wielkiej ilości danych podczas treningu. Jednak teraz wydaje się, że modele rozumowania mają również większe halucynacje od standardowych. Jak już wiemy, zaczynają być tak duże, że często przekreślają sensowność korzystania z AI.

Źródło artykułu:
Wybrane dla Ciebie
Konin: Cukierki z igłami rozdawane na Halloween
Konin: Cukierki z igłami rozdawane na Halloween
Pierwsze recenzje Europa Universalis 5 są bardzo dobre
Pierwsze recenzje Europa Universalis 5 są bardzo dobre
Warszawa: Ten cmentarz ma 143 hektary i około 180 tysięcy grobów
Warszawa: Ten cmentarz ma 143 hektary i około 180 tysięcy grobów
Łęczyca: Odwiedziliśmy stary cmentarz ewangelicko-augsburski
Łęczyca: Odwiedziliśmy stary cmentarz ewangelicko-augsburski
Radomyśl Wielki: Kompletnie pijani rodzice zajmowali się dwójką dzieci
Radomyśl Wielki: Kompletnie pijani rodzice zajmowali się dwójką dzieci
Lublin: Kierowca nie zauważył ograniczenia i staranował bramownicę
Lublin: Kierowca nie zauważył ograniczenia i staranował bramownicę
Oświęcim: Tworzyli historię sportu. Dzisiaj ich groby znajdują się na cmentarzu komunalnym. Kibice: - dziękujemy za wszystko!
Oświęcim: Tworzyli historię sportu. Dzisiaj ich groby znajdują się na cmentarzu komunalnym. Kibice: - dziękujemy za wszystko!
Tarnów: Znane osoby z regionu, które odeszły w mijającym roku
Tarnów: Znane osoby z regionu, które odeszły w mijającym roku
Koszalin: Trwa akcja "Znicz". Policja czuwa nad bezpieczeństwem
Koszalin: Trwa akcja "Znicz". Policja czuwa nad bezpieczeństwem
Kraków: Miasto ma mieć most Sióstr Norbertanek. Jest już projekt
Kraków: Miasto ma mieć most Sióstr Norbertanek. Jest już projekt
Otyń: Stowarzyszenie Przyjaciół Ziemi Otyńskiej skończyło 20 lat
Otyń: Stowarzyszenie Przyjaciół Ziemi Otyńskiej skończyło 20 lat
Stara Rawa: Pięknie udekorowane groby na cmentarzu
Stara Rawa: Pięknie udekorowane groby na cmentarzu