Eurowizja 2017: Analitycy Microsoft prognozują zwycięstwo Włoch
Już wkrótce w Kijowie 42 piosenkarzy z całej Europy (oraz z Australii) powalczy o tytuł najlepszej piosenki Starego Kontynentu. Kto z nich ma największe szanse na wygraną? Zdaniem analityków Microsoft, w tym roku zwycięstwo należało będzie do Włoch. Drugie miejsce zajmą Szwedzi, a na najniższym stopniu podium staną Bułgarzy.
Do ustalenia tegorocznego zwycięzcy Eurowizji zespół analityków z Bing Predictions z firmy Microsoft użył zaawansowanych metod analizy danych. Korzystając z szerokiego zakresu informacji o ruchu w sieci, treści generowanych w mediach społecznościowych oraz wpisywanych w wyszukiwarkach, analitycy Microsoft stworzyli unikalny model prognozujący możliwe wyniki w czasie rzeczywistym.
Zebrane informacje wskazują na zwycięstwo Włocha, Francesco Gabbaniego i jego piosenkę "Occidentali’s Karma". Według prognoz, szanse Włoch na wygraną wynoszą 19,8 proc. Na drugim miejscu plasuje się Robin Bengtsson ze Szwecji z wynikiem 17,1 proc., a na trzecim – Kristian Kostov z Bułgarii, który uzyskał 9,9 proc..
Zgodnie z prognozą Microsoft, pierwsza piątka konkursu przedstawia się następująco:
Włochy – Francesco Gabbani (19,8 proc. szans na wygraną)
Szwecja – Robin Bengtsson (17,1 proc. szans na wygraną)
Bułgaria – Kristian Kostov (9,9 proc. szans na wygraną)
Francja – Alma (7,4 proc. szans na wygraną)
Portugalia – Salvador Sobral (7,1 proc. szans na wygraną).
Po przeciwnej stronie tabeli znalazły się państwa z najmniejszą szansą na zakwalifikowanie do finału. Wśród nich znalazły się: Czechy, Gruzja, San Marino, Islandia oraz Malta. Szanse tej ostatniej na dotarcie do ostatniego etapu są minimalne: wynoszą zaledwie 0,1 proc.
Niezbyt różowo przedstawiają się niestety także szanse polskiej reprezentantki. Analitycy nie pozostawiają żadnych złudzeń i twierdzą, że Katarzyna Moś z piosenką "Flashlight" ma zaledwie 0,3 proc. szans na wygraną.
To nie pierwsze takie prognozy analityków Microsoft. Korzystając z zaawansowanej analizy danych zespół Bing Predictions trafnie wytypował Szwecję jako zwycięzcę Eurowizji w roku 2015. Poprawnie przewidział również zdobywców pięciu najwyższych lokat podczas Abu Dhabi Grand Prix w 2016 roku. Tegorocznych zwycięzców Oscarów wskazał z 71‑procentową dokładnością. Czy i tym razem prognozy analityków okażą się trafne? Przekonamy się zapewne już po dwóch półfinałach (9 i 11 maja) oraz po samym finale, który odbędzie się 13 maja w Kijowie.
Jak powstała prognoza?
Microsoft opracował swoją prognozę, analizując główne strumienie informacji, takie jak: dane sieciowe, dane z serwisów społecznościowych oraz dane dotyczące ruchu w wyszukiwarkach. Prognozy te są formułowane i uaktualniane na bieżąco, z uwagi na fakt, że różne treści w sieci i mediach społecznościowych są powiązane ze sposobami i modelami głosowania. Analitycy wychwytują takie treści i tendencje, a następnie analizują je w kontekście danych historycznych, takich jak te, który kraj uzyskał poprzednio najwyższą liczbę punktów w konkursie. Umożliwia to określenie różnych wzorców i wskazanie najbardziej prawdopodobnych wyników.
Wszystko zaczyna się od internetowego strumienia danych, który pobiera treści online dotyczące wszystkich uczestników konkursu. Następnie analizowany jest ogólnoeuropejski szum komunikacyjny w serwisach społecznościowych. Dane czerpane są na bieżąco zarówno z Twittera jak i z Facebooka. Aby poradzić sobie z tak ogromną liczbą konwersacji online, zastosowano kilka różnorodnych kwalifikatorów. Treści mogą być sortowane według różnych parametrów: np. opublikowane przez influencera posiadającego wielu obserwujących, oryginalne posty, retweetowane, pozytywne albo negatywne.
Ruch w wyszukiwarkach (mierzony w czasie rzeczywistym) używany jest następnie do analizy stopni wzrostu bądź spadku zainteresowania. Bierze się tutaj też pod uwagę źródło ruchu. Informacje są ważone na korzyść danych tworzonych w czasie rzeczywistym, takich jak prowadzone na żywo konwersacje w serwisach społecznościowych oraz ruch napływający z wyszukiwarek. W efekcie im bliżej danego wydarzenia – tym prognozy stają się trafniejsze.
Oczywiście wszystkie dane wykorzystywane w modelu analitycznym są w pełni anonimowe, zaś powiązanie jakichkolwiek wskaźników z konkretnymi użytkownikami niemożliwe.