Zostanie stworzony „najmniej uprzedzony rasowo” program do rozpoznawania mowy
Twórcy nowego start-upa twierdzą, że ich technologia rozpoznawania głosu jest w stanie pokonać Google i Amazon w kwestii rozumienia mowy Afroamerykanów. Według osób stojących za nowym projektem, dotychczasowe programy nie działają w taki sam sposób dla każdego użytkownika.
Można pomyśleć, że programy i sztuczna inteligencja są zbiorem algorytmów i linijek kodu, które nie mogą być rasistowskie. Innego zdania są twórcy nowego start-upa, skupiającego się na stworzeniu technologii rozpoznawania mowy. Według nich oprogramowanie może być nie tylko uprzedzone rasowo, lecz również seksistowskie. Twórcy nowej technologii rozpoznawania mowy twierdzą, że ich program jest w stanie rozpoznać mowę osób czarnoskórych z dokładnością na poziomie 83 proc. To o 10 punktów procentowych więcej niż dotychczasowy lider Microsoft. Za nimi znajdują się Amazon i Google z dokładnością na poziomie 69 proc. Wyniki pochodzą z badania opublikowanego przez Uniwersytet Stanford w 2020 roku.
Speechmatics jest start-upem specjalistów z Cambridge, którzy postanowili stworzyć narzędzie do rozpoznawania mowy, będące równie dokładne dla każdego użytkownika. Stephanie Hare, specjalistka do spraw etyki AI w rozmowie z CNBC wskazała, że nie każdy jest równo traktowany przez najpopularniejsze programy do rozpoznawania mowy. Jako najbardziej poszkodowanych wskazuje Afroamerykanów, kobiety i osoby z regionalnym akcentem. To stwierdzenie nie jest bezzasadne. Wcześniej wspomniane badanie pokazało, że sztuczna inteligencja odpowiedzialna za rozpoznawanie mowy myli się niemal dwukrotnie częściej w przypadku osób czarnoskórych niż białych.
Funkcja rozpoznawania mowy coraz częściej towarzyszy człowiekowi w życiu codziennym. Sterowanie głosem smartfonem, telewizorem lub nawet całym domem od dłuższego czasu nie należy już do filmów Science-Fiction. Technologia rozpoznawania mowy staje się też coraz bardziej powszechna. Dlatego ważne jest, aby każdy miał równe szanse podczas korzystania z niej. Do tego może tę technologię przybliżyć właśnie Speechmatics.