Epidemia fałszywych cytatów w artykułach biomedyczych. Winny jest ChatGPT?
Najnowszy audyt obejmujący 2,5 mln artykułów z dziedziny biomedycyny ujawnił niepokojące zjawisko. W publikacjach tych odkryto gwałtowny wzrost liczby fałszywych cytowań, które przenikają do recenzowanej literatury naukowej. Analiza 97 mln zweryfikowanych odniesień wykazała, że wskaźnik fabrykowania źródeł drastycznie wzrósł od 2023 r., czyli od powszechnej dostępności aplikacji ChatGPT i podobnych narzędzi AI skłonnych do generowania halucynacji. Wszystko to pogłębia kryzys wiarygodności naukowców i ich publikacji, a także może zagrażać pacjentom.

W skrócie
- Audyt 2,5 mln artykułów biomedycznych wykazał gwałtowny wzrost liczby fałszywych cytowań w recenzowanej literaturze naukowej od 2023 roku.
- Zautomatyzowana analiza wskazała, że od 2023 do 2026 roku częstotliwość występowania sfabrykowanych źródeł w artykułach biomedycznych wzrosła ponad 12-krotnie.
- Autorzy badania rekomendują wdrożenie wstępnej, zautomatyzowanej weryfikacji cytowań przez wydawców, aby ograniczyć rozpowszechnianie fałszywych odniesień.
- Więcej podobnych informacji znajdziesz na stronie głównej serwisu, otwiera się w nowym oknie
Zmyślone cytaty w artykułach naukowych. Proceder przybrał na sile
Zmyślanie cytatów i źródeł może wydawać się domeną niektórych "sprytnych" uczniów i studentów, których bardziej interesuje pozorny efekt niż naukowa rzetelność, a także halucynującej sztucznej inteligencji i nieuczciwych pracowników naukowych sprzed wielu dekad.
Wydawałoby się, że w dobie swobodnego przepływu informacji i dostępu do praktycznie wszystkich istotnych artykułów naukowych w sieci - co umożliwia bardzo łatwe znalezienie odpowiednich cytatów, a także ich weryfikację - zjawisko oszustwa w publikacjach naukowych zostało praktycznie wykorzenione. Nic bardziej mylnego.
Jak pokazał nowy audyt, który nazwać można badaniem badań, w artykułach z dziedziny biomedycyny ilość sfabrykowanych odniesień wręcz wzrosła w ciągu ostatnich lat - a konkretnie od 2023 roku. Data ta wydaje się nieprzypadkowa. Był to bowiem początek "rewolucji AI". W listopadzie 2022 roku zostało publicznie uruchomione narzędzie ChatGPT, a po nim nadeszły kolejne.
Czy to właśnie czatboty i ich halucynacje odpowiadają za ten niepokojący trend? I jak duży jest to właściwie problem? Badanie opublikowane w czasopiśmie "The Lancet" jest pierwszą tak szeroką próbą oszacowania skali tego procederu. Sprawdźmy, co dokładnie udało się ujawnić.
1 na 277 artykułów biomedycznych z fałszywymi odniesieniami
Zespół naukowców, którym kierował dr Maxim Topaz z Columbia University, opracował zautomatyzowany system do przesiewowego badania publikacji z bazy PubMed Central, opublikowanych między styczniem 2023 a lutym 2026 roku. Narzędzie wskazało 2810 artykułów zawierających łącznie 4046 sfabrykowanych odniesień - czyli takich, których nie udało się namierzyć w żadnej z 4 kluczowych baz danych, tj. PubMed, Crossref, OpenAlex ani Google Scholar.
Skala problemu powiększa się w alarmującym tempie. O ile w 2023 r. co 2828. artykuł zawierał przynajmniej jedno fałszywe cytowanie, o tyle na początku 2026 r. wskaźnik ten wzrósł do 1 na 277 artykułów. Oznacza to, że częstotliwość występowania tego zjawiska wzrosła ponad 12-krotnie.
Czy ma to związek z ChatemGPT, który znany jest ze zmyślania nieistniejących pojęć, faktów i cytatów poprzez mechanizm tzw. halucynacji AI? To bardzo możliwe. Fakt, że zaczęło się to w 2023, a nie jeszcze w 2022 r., można wyjaśnić tym, że czas od przesłania artykułu do jego publikacji wynosi zwykle co najmniej kilka miesięcy. W tym czasie przechodzi ona recenzję naukową.
Skala tej nieuczciwej praktyki, choć niepokojąca, może być w rzeczywistości dużo wyższa. Autorzy badania wyjaśnili, że zidentyfikowane przypadki mogą być niedoszacowane. "To, co zidentyfikowaliśmy, jest dolną granicę rzeczywistego rozpowszechnienia. Ledwie dotknęliśmy czubka góry lodowej" - skomentował dr Topaz. Większość problematycznych tekstów (91 proc.) zawierała jedno lub dwa fałszywe cytowania, a 246 artykułów posiadało ich 3 lub więcej. Skrajnym przykładem jest publikacja z 2025 r. dotycząca technik urologicznych, w której aż 18 z 30 zweryfikowanych odniesień (60 proc.) okazało się fikcyjnych.
ChatGPT głównym podejrzanym. To może być wina halucynacji AI
Audyt zademonstrował, że recenzja naukowa nie radzi sobie z wyłapywaniem tak oczywistych błędów, jak zmyślanie cytatów. Dlaczego to taki problem? Zdaniem ekspertów sfabrykowane źródła są niezwykle trudne do wykrycia przez recenzentów, bowiem na pierwszy rzut oka wyglądają autentycznie. Często są one precyzyjnie dopasowane do tematyki artykułu, mają poprawny format, są przypisane istniejącym badaczom i posiadają wiarygodne daty publikacji.
Wiele wskazuje na to, że za owo tworzenie pozorów wiarygodności odpowiadają narzędzia generatywnej sztucznej inteligencji, które potrafią tworzyć przekonująco brzmiące, ale nieistniejące odniesienia. Jak zauważa Kathryn Weber-Boer, dyrektorka ds. scjentometrii z londyńskiego Digital Science, "wzrost tego problemu sugeruje, że jest w tym składnik generatywnej AI". Gwałtowny skok liczby fałszerstw w połowie 2024 r. pokrywa się z oczekiwanym opóźnieniem publikacyjnym po masowym wdrożeniu modeli językowych (LLM) pod koniec 2022 r. I choć to ChatGPT jest pierwotnym źródłem fałszywych danych, to za ich publikację ponoszą odpowiedzialność autorzy.
Szczególnie alarmujący jest fakt, że fejkowe cytaty występują o 57 proc. częściej w artykułach przeglądowych niż w innych typach prac (16,7 na 10 tys. wobec 10,6 na 10 tys.). Zmyślone źródła odkryto w 28 badaniach klinicznych i 79 przeglądach systematycznych. Jak ostrzega dr Topaz, takie publikacje "w końcu trafią do wytycznych klinicznych", co jego zdaniem jest "najstraszniejszą częścią". Gdy bowiem wytyczne medyczne opierają się na misinformacji, prowadzi to do podejmowania decyzji terapeutycznych opartych na halucynacjach, a nie danych empirycznych, co poważnie zagraża zdrowiu pacjentów.
Choć mówi się, że kłamstwo ma krótkie nogi, to w tym przypadku może tak nie być. Gdy fałszywe badanie jest cytowane przez kolejne, tym razem uczciwe, "uwiarygadnia" to zmyślone dane przez samą częstotliwość jego występowania w literaturze. Po kilku latach i setkach cytowań nikt już nie sprawdza pierwotnego źródła (często nieistniejącego). Wiedza ta wchodzi do kanonu i może minąć wiele lat, nim zostanie obalona.
Czy wskutek posiłkowania się taką zafałszowaną literaturą może dochodzić do błędów w sztuce lekarskiej? Pojęcie to oznacza odstępstwo od obowiązujących standardów i wytycznych. Gdy jednak owe standardy są oparte na danych wyssanych z palca, to stosujący się do nich lekarz, nieświadomy ich nieprawdziwości, działa zgodnie z aktualną wiedzą, mimo że w rzeczywistości podaje pacjentowi preparat lub stosuje procedurę, które opierają się na zgrabnie uargumentowanym kłamstwie.
Autorzy badania wzywają wydawców do wstępnej weryfikacji
Czy na ten osobliwy trend, który może mieć bardzo poważne implikacje w praktyce klinicznej, w jakiś sposób reagują wydawcy recenzowanych periodyków? W tym przypadku ich odpowiedź była znikoma. Aż 98,4 proc. artykułów, które zidentyfikowano jako fałszywe w tym audycie, nie doczekało się żadnej korekty. Wycofanych zostało zaledwie 1,6 proc. felernych tekstów - większość jednak z innych przyczyn niż fałszywe cytowania.
Co dalej? Autorzy badania postulują, by wydawcy zintegrowali wstępną weryfikację cytatów z procesem zgłaszania prac, jeszcze przed etapem recenzji naukowej. "Kiedy odniesienia wskazują na nieistniejące badania, wówczas dowody, które rzekomo wspierają, są fikcyjne. Rutynowa, zautomatyzowana weryfikacja może zamknąć tę lukę, zanim fałszywe źródła zostaną utrwalone w publikacjach".
Wygląda na to, że bez wdrożenia systemowych rozwiązań kryzys zaufania do danych publikowanych w czasopismach naukowych będzie się powiększać. A powinny one być nieskazitelne pod względem uczciwości. Autorzy podkreślili, że nie analizowali tzw. szarej literatury (tekstów nierecenzowanych) ani stron internetowych, na których skala fałszerstw może być dużo większa.
Źródła:
- Topaz M., Roguin N., Gupta P. et al. Fabricated citations: an audit across 2·5 million biomedical papers. The Lancet, 407, 1779-1781 (2026). DOI: 10.1016/S0140-6736(26)00603-3
- Naddaf M. Surge in fake citations uncovered by audit of 2.5 million biomedical science papers. Nature (2026). DOI: 10.1038/d41586-026-00748-w











