Sztuczna inteligencja w diagnostyce medycznej. Jak poprawić jej skuteczność?

Obecnie sztuczna inteligencja jest coraz częściej wykorzystywana do diagnostyki medycznej. Istniejące algorytmy uczenia maszynowego wciąż nie są idealne, ale pojawiły się pomysły, jak można je poprawić. Czy kiedyś dożyjemy czasów, w których maszyny będą leczyć ludzi?

Sztuczna inteligencja w medycynie będzie coraz lepsza123RF/PICSEL

Uczenie maszynowe to jeden z obszarów sztucznej inteligencji, w którym algorytmy poprawiają się automatycznie (uczą się) poprzez doświadczenie, czyli ekspozycję na dane. Mówiąc wprost: im więcej danych maszyna otrzyma, tym lepsze decyzje będzie podejmować w przyszłości.

- Załóżmy, że istnieje zbiór danych na temat poważnej choroby. W zbiorze danych znajduje się 90 osób, które nie chorują na tę chorobę, ale u 10 ona występuje. Jako przykład, algorytm uczenia maszynowego mówi, że 90 osób nie ma choroby. Do tej pory jest to poprawne. Ale nie udaje mu się zdiagnozować 10 osób, które chorują.

Dokładność algorytmu nadal wynosi 90 proc., ale przecież wiemy, że nie jest dokładny - powiedział dr Ibomoiye Domor Mienye z Uniwersytetu w Johannesburgu (UJ).90-procentowa dokładność algorytmu jest powszechnie uważana za bardzo wysoką, ale w tym konkretnym przypadku, kluczowe jest pozostałe 10 proc. W przypadku danych medycznych właśnie ta kwestia jest kluczowa - nie ma miejsca na margines błędu, bo dotyczy to kwestii życia i śmierci.

Jak ulepszyć algorytmy?

Dr Mienye i prof. Yanxia Sun opublikowali pracę w "Informatics in Medicine Unlocked", która pokazuje, jak można ulepszyć algorytmy uczenia maszynowego do celów medycznych. Do tego celu wykorzystano regresję logistyczną, drzewo decyzyjne oraz algorytmy XGBoost i tzw. lasu losowego. Wyposażone w nie maszyny uczą się tylko na podstawie dostarczonych zestawów danych "tak/nie". Naukowcy wbudowali w każdy z algorytmów wrażliwość na koszty. W przypadku stwierdzenia, że chora osoba jest zdrowa, kara dla algorytmu była wyższa niż w sytuacji odwrotnej. Mówiąc inaczej: mniej pożądany był wynik fałszywie negatywny niż fałszywie pozytywny.Autorzy algorytmu wykorzystali publiczne dane dotyczące diagnostyki cukrzycy, raka piersi, raka szyjki macicy (858 rekordów) i przewlekłej choroby nerek (400 rekordów). Ponieważ pochodziły one z dużych szpitali lub programów opieki zdrowotnej, wyniki były stricte zerojedynkowe - albo dana osoba była chora, albo zdrowa. Na podobne pytania miały odpowiadać szkolone algorytmy uczenia maszynowego.

Jak sprawić, by algorytmy sztucznej inteligencji były wydajniejsze?123RF/PICSEL

Kary zastosowane przez dr Mienye i prof. Suna działały zgodnie z założeniami. Dla przewlekłej choroby nerek, algorytm lasu losowego osiągnął poziom precsion wynoszący 0,972 i recall 0,946 (idealna wartość to 1). Termin precision mówi nam mniej więcej o tym, w jakim stopniu możemy zaufać naszym pozytywnym predykcjom w danej klasie. Z koncepcją recall jest podobnie do precision - dowiadujemy się z niej jednak ile obserwacji z danej grupy przeoczyliśmy. Po dodaniu wrażliwości na koszty, wyniki algorytmów znacznie się poprawiły - precision do poziomu 0,990, a recall do idealnej wartości 1,000.Równie dobre wyniki osiągnięto w przypadku trzech pozostałych algorytmów - wszystkie dobrnęły do poziomu 1. Wartość precision na poziomie 1 oznacza, że algorytm nie przewidział jednego lub więcej wyników fałszywie dodatnich w całym zbiorze danych. Z kolei recall na poziomie 1 oznacza, że algorytm nie przewidział jednego lub więcej fałszywych negatywnych w całym zbiorze danych.Poprawę wartości precision i recall odnotowano również w przypadku diagnostyki cukrzycy, raka piersi i raka szyjki macicy.

Czy algorytmy kiedyś będą bezbłędne?

Ogólnie rzecz ujmując, algorytmy były dokładniejsze w określaniu, czy u kogoś nie występuje dana choroba, niż w identyfikowaniu tych, którzy są chorzy. Jest to jedno z największych wyzwań stawianych przed sztuczną inteligencją w medycynie. Wynika to z mechanizmów samego uczenia maszynowego na podstawie dostępnych zbiorów danych. - Do dużego szpitala zgłasza się osoba na badania w kierunku przewlekłej choroby nerek. Lekarz wysłał ją tam, ponieważ niektóre z jej objawów są objawami przewlekłej choroby nerek, co lekarz chciałby wykluczyć. Okazuje się, że dana osoba nie ma przewlekłej choroby nerek. Tak dzieje się z wieloma osobami. W zbiorze danych znajduje się więcej osób, które nie mają przewlekłej choroby nerek, niż osób, które mają. Nazywamy to niezrównoważonym zbiorem danych - wyjaśnił dr Mienye.Dr Mienye wychował się w wiosce położonej w pobliżu Oceanu Atlantyckiego, do której nie można dojechać drogą lądową. Pewna kobieta z jego wioski jest dobrym przykładem tego, jak sztuczna inteligencja może pomóc w przyszłości. Wrażliwe na koszty algorytmy uczenia maszynowego mogłyby ocenić zebrane dane dotyczące jej ciśnienia krwi, poziomu sodu czy cukru. Na ich podstawie, przyszłe algorytmy sztucznej inteligencji będą w stanie powiedzieć lekarzom, na jakim etapie przewlekłej choroby nerek, dany pacjent się znajduje. Tak właśnie może wyglądać przyszłość medycyny.

Jak ulepszyć algorytmy?

Czy algorytmy kiedyś będą bezbłędne?

Najnowsze