Studenci nauczyli komputery NASA, jak korzystać z... Reddita
Studenci Uniwersytetu Kolumbii Brytyjskiej opracowali algorytm, za pomocą którego komputery NASA mogą zbierać dane w nietypowym dla siebie miejscu, a mianowicie serwisie Reddit i tym samym ulepszyć bazy danych oraz systemy przewidywania katastrof.
A wydawać by się mogło, że legendarne komputery NASA potrafią wszystko... a mówiąc całkiem poważnie, Uniwersytet Kolumbii Brytyjskiej poinformował, że zespół jego studentów w ramach swojej pracy magisterskiej przygotował specjalny algorytm, który pozwolił nauczyć komputery "czytania" informacji na temat osuwisk na Reddicie. Jak to działa? W ramach projektu nadzorowanego przez BGC Engineering Inc. i amerykańską agencję kosmiczną studenci opracowali narzędzie, które skanuje serwis w poszukiwaniu wpisów o osuwiskach we wskazanych widełkach czasowych, a następnie wyciąga z nich ważne informacje.
W pierwszej kolejności system decyduje, czy artykuł faktycznie dotyczy osuwisk (a nie tylko używa podobnego sformułowania w innym kontekście), a następnie model przetwarzania języka naturalnego wytrenowany na danych dotyczących osuwisk wyciąga z niego informacje na temat tego gdzie i kiedy doszło do osuwiska, co je spowodowało i ile osób zostało rannych/zabitych. Tak wyodrębnione dane mogą zostać umieszczone w publicznej bazie danych COOLR, czyli Cooperative Open Online Repository, która pozwala przewidywać, gdzie i kiedy wystąpią podobne zdarzenia.