Algorytm do rozpoznawania płci na Twitterze
Nie jest rzadkością spotkać w internecie osobę podającą się za kogoś innego, w tym za osobnika płci przeciwnej. Naukowcy z Mitre znaleźli sposób na odkrycie prawdziwej tożsamości właściciela konta na Twitterze.
Tym razem amerykańscy naukowcy odkryli pewien ciekawy algorytm pozwalający określić płeć dowolnej osoby posiadającej konto na Twitterze i, rzecz jasna, raz na jakiś czas umieszczającej na nim swoje 140-znakowe wypociny.
Grupa naukowców z Mitre: John Burger, John Henderson, George Kim oraz Guido Zarrella, wyszukała grupę osób, co do których była pewna ich płci (Twitter nie narzuca tego wyboru przy zakładaniu konta, podobnie zresztą jak Google+). Następnie pozwolili poszaleć algorytmowi w danych tych użytkowników, po czym otrzymała wynik 55 proc. dla kobiet i 45 proc. dla mężczyzn.
Tyle, jeśli chodzi o wszystkie dane, z których mniej lub bardziej dokładnie samemu można by wywnioskować płeć piszącego. Najciekawsza część tego doświadczenia zaczyna się dopiero teraz: przygotowany przez naukowców algorytm był w stanie, na podstawie samej tylko treści jednego tweetu, określić z 65,9 proc. dokładnością (75,8 proc. w przypadku większej ich ilości) to, czy ćwierkająca osoba jest mężczyzną, czy kobietą.
Burger, Henderson, Kim oraz Zarrella wykorzystali w swojej pracy zdobycze socjolingwistyki, czyli działu językoznawstwa badającego społeczne znaczenie wariantów systemu językowego oraz jego użycia. Osoby piszące na Twitterze zdradzały się między innymi poprzez sposób, w jaki łączyły słowa oraz jakich używały emotikonów i wyrażeń.
Algorytm trafiał w 92,8 proc. przypadków, w których brał pod lupę nazwę użytkownika oraz jego biografię. Jak myślicie: czy zgłosi się po niego Google, by celniej trafiać w swoich użytkowników, którzy nie raczyli określić swojej płci przy zakładaniu konta na portalu Google+?