Algorytm do rozpoznawania płci na Twitterze

Nie jest rzadkością spotkać w internecie osobę podającą się za kogoś innego, w tym za osobnika płci przeciwnej. Naukowcy z Mitre znaleźli sposób na odkrycie prawdziwej tożsamości właściciela konta na Twitterze.

Płeć użytkowników Twittera można określić na podstawie języka, jakim się posługują
Płeć użytkowników Twittera można określić na podstawie języka, jakim się posługująAFP

Grupa naukowców z Mitre: John Burger, John Henderson, George Kim oraz Guido Zarrella, wyszukała grupę osób, co do których była pewna ich płci (Twitter nie narzuca tego wyboru przy zakładaniu konta, podobnie zresztą jak Google+). Następnie pozwolili poszaleć algorytmowi w danych tych użytkowników, po czym otrzymała wynik 55 proc. dla kobiet i 45 proc. dla mężczyzn.

Tyle, jeśli chodzi o wszystkie dane, z których mniej lub bardziej dokładnie samemu można by wywnioskować płeć piszącego. Najciekawsza część tego doświadczenia zaczyna się dopiero teraz: przygotowany przez naukowców algorytm był w stanie, na podstawie samej tylko treści jednego tweetu, określić z 65,9 proc. dokładnością (75,8 proc. w przypadku większej ich ilości) to, czy ćwierkająca osoba jest mężczyzną, czy kobietą.

Burger, Henderson, Kim oraz Zarrella wykorzystali w swojej pracy zdobycze socjolingwistyki, czyli działu językoznawstwa badającego społeczne znaczenie wariantów systemu językowego oraz jego użycia. Osoby piszące na Twitterze zdradzały się między innymi poprzez sposób, w jaki łączyły słowa oraz jakich używały emotikonów i wyrażeń.

Algorytm trafiał w 92,8 proc. przypadków, w których brał pod lupę nazwę użytkownika oraz jego biografię. Jak myślicie: czy zgłosi się po niego Google, by celniej trafiać w swoich użytkowników, którzy nie raczyli określić swojej płci przy zakładaniu konta na portalu Google+?

gizmodo.pl
Masz sugestie, uwagi albo widzisz błąd?
Dołącz do nas