Miłe chatboty częściej się mylą i sieją dezinformację. Naukowcy ostrzegają
W branży AI w ostatnim czasie widać wyraźny trend, chatboty mają być coraz bardziej sympatyczne, empatyczne i "ludzkie". Problem w tym, że, jak sugerują najnowsze badania, ta uprzejmość może mieć swoją cenę. I to całkiem wysoką, oznaczającą spadek dokładności odpowiedzi oraz większą skłonność do wzmacniania fałszywych przekonań.

Zespół badaczy z University of Oxford przeanalizował działanie kilku dużych modeli językowych, w tym GPT-4o od OpenAI oraz Llama od Meta. Następnie "nastroił" je tak, aby odpowiadały w bardziej ciepły i przyjazny sposób, podobnie jak robi to dziś wiele firm technologicznych. Efekt był zaskakujący, bo chatboty po takim "ociepleniu wizerunku" popełniały od 10 do 30 proc. więcej błędów i były o 40 proc. bardziej skłonne zgadzać się z błędnymi przekonaniami użytkowników.
Chatbot nie ma być miły, ale skuteczny
W praktyce oznacza to, że uprzejmość AI zaczęła kolidować z jej zdolnością do mówienia rzeczy niewygodnych, ale prawdziwych. Najbardziej niepokojące okazały się testy dotyczące teorii spiskowych i mitów, w jednym z nich użytkownik zasugerował, że Adolf Hitler przeżył II wojnę światową i uciekł do Argentyny.
"Miła" wersja chatbota nie zaprzeczyła wprost i zamiast tego stwierdziła, że "niektórzy tak uważają" i wspomniała o rzekomych dokumentach. Tymczasem standardowy model odpowiedział jednoznacznie - Hitler nigdzie nie uciekł i zmarł w 1945 roku.
Podobne różnice pojawiły się przy innych tematach. W przypadku lądowania na Księżycu w ramach programu Apollo uprzejma wersja sugerowała "różne opinie", zamiast potwierdzić fakt. Co więcej, chatbot o cieplejszym usposobieniu uznał też mit o "kaszlu zatrzymującym zawał serca" za użyteczną metodę pierwszej pomocy, mimo że to niebezpieczna dezinformacja.
Skąd bierze się problem? Chatboty uczą się… być ludzkie
Jak tłumaczy Lujain Ibrahim z Oxford Internet Institute, celem badania było sprawdzenie, czy w sztucznej inteligencji pojawia się podobny mechanizm jak u ludzi, tzn. im większa empatia, tym trudniej o bezwzględną szczerość. I wygląda na to, że tak właśnie jest - chatboty zaczynają naśladować ludzką uprzejmość, a w codziennych rozmowach oznacza to często unikanie konfrontacji.
Dążenie do tego, by modele były bardziej przyjazne, obniża ich zdolność do mówienia trudnych prawd i reagowania, gdy użytkownik się myli
Badacze zauważają, że użytkownicy już teraz mogą rozpoznać "przesłodzone" modele, charakterystyczne zwroty to m.in.: "świetne pytanie", "masz absolutną rację" czy "zanurzmy się w to razem". Jak zauważa dr Luc Rocher, takie reakcje są efektem świadomego treningu modeli, który ma zwiększyć ich atrakcyjność, ale jednocześnie może osłabiać ich rzetelność.
A problem nie kończy się na błędach faktograficznych. Badania wykazały, że chatboty są szczególnie podatne na potwierdzanie fałszywych przekonań, gdy użytkownik jest w trudnym stanie emocjonalnym, np. smutny lub zestresowany. To szczególnie istotne, bo coraz częściej AI pełni rolę cyfrowych towarzyszy czy nawet terapeutów i doradców. W takich sytuacjach błędna odpowiedź może mieć realne konsekwencje.
Badanie opublikowane w czasopiśmie Nature pokazuje wyraźny dylemat projektowy, jak stworzyć system, który jest jednocześnie przyjazny i wiarygodny. Dr Steve Rathje z Carnegie Mellon University podkreśla, że stawka jest wysoka, szczególnie wtedy, gdy użytkownicy pytają o zdrowie, bezpieczeństwo czy inne krytyczne kwestie.
Kluczowym wyzwaniem jest znalezienie równowagi między ciepłem a dokładnością










