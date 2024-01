Algorytm nauczył się historii życia milionów ludzi

Sune Lehmann Jørgensen z Duńskiego Uniwersytetu Technicznego i jego współpracownicy wykorzystali bogaty zbiór danych z Danii, by wyszkolić nowy algorytm. Obejmowały one edukację poszczególnych osób, ich wizyty w szpitalach i u lekarzy, wszelkie informacje z wystawionych diagnoz, dochody oraz wykonywany zawód. Dane zebrane zostały w latach 2008-2020.

Zbiór danych został przekształcony w taki sposób, by można go było wykorzystać do trenowania dużego modelu językowego podobnego do tego, który napędza popularny ChatGPT. Model analizuje serie słów i określa, które z nich ma statystycznie największe prawdopodobieństwo wystąpienia. Model został nazwany Life2vec. Poprzez analizę wydarzeń życiowych składających się na historię danej osoby określa, co najprawdopodobniej może wydarzyć się w nadchodzących latach.

Testy Life2vec

Zebrane dane dotyczyły grupy osób w wieku od 35 do 65 lat. Połowa z nich zmarła w latach 2016-2020. Life2vec nie wiedząc, które z osób już nie żyją, został poproszony o to, by przewidzieć kto przeżyje, a kto nie. Okazuje się, że algorytm był o 11 proc. dokładniejszy niż jakikolwiek istniejący model sztucznej inteligencji. Wykazał się nawet lepszym wynikiem niż niezwykle skuteczne narzędzia stosowane w branży ubezpieczeniowej.

Według głównej autorki badania, model dysponuje taką ilością danych, by móc przewidywać z dużym prawdopodobieństwem również aspekty życia społecznego i ekonomicznego. Co więcej, Jørgensen wyraża obawy, że model może zostać wykorzystany w szkodliwy sposób przez firmy.

Jest oczywiste, że nasz model nie powinien być stosowany przez firmę ubezpieczeniową. Prawdopodobnie wykorzystują je już wobec nas duże firmy technologiczne, które dysponują tonami danych o nas, i wykorzystują je do prognozowania na nasz temat. Mówi Jørgensen.

Model potrafi przetwarzać prosty język i generować prognozy dotyczące nie tylko prawdopodobieństwa wystąpienia przedwczesnego zgonu, ale również obliczyć wysokość dochodów w ciągu życia danej osoby.

Do czynników zwiększonego ryzyka zgonu algorytm zalicza na przykład bycie mężczyzną, problemy ze zdrowiem psychicznym lub wykonywanie trudnego wymagającego ukierunkowanego wykwalifikowania zawodu. Wyniki badań zostały opublikowane w czasopiśmie „Nature Computational Science”.