Sposób na spam w obrazach
Istnieje wiele różnych technologii wykrywania niechcianych wiadomości tekstowych, ale tylko nieliczne rozpoznają spam graficzny. Kaspersky Lab opatentował w Rosji rozwiązanie wykrywające tekst w obrazach bez względu na język, jakim posłużył się spamer.
Stosowane obecnie filtry nie mają większych problemów z wykrywaniem spamowych wiadomości tekstowych. Dlatego spamerzy coraz częściej ukrywają niechciane treści w obrazach.
Większość metod wykorzystywanych do wykrywania tekstu w grafice opiera się na maszynowym rozpoznawaniu obrazów. Technologia ta zdaje egzamin w przypadku ujednolicenia rozmiaru, stylu i rozmieszczenia symboli. Spamerzy bronią się, celowo zniekształcając rozsyłane przez siebie grafiki.
Technologia opatentowana przez firmę Kaspersky Lab umożliwia skuteczne wykrywanie tekstu w grafikach rastrowych (m.in. JPEG, GIF, WMF, BMP) bez konieczności stosowania maszynowego rozpoznawania obrazów. Opiera się ona na probabilistycznym i statystycznym podejściu. To, czy obraz zawiera tekst, określa rozmieszczenie graficznych wzorów słów i linii, jak również zawartość liter i słów w tych wzorach.
Można dzięki temu nie przejmować się stosowanymi przez spamerów technikami zaciemniania, takimi jak zniekształcanie i obracanie obrazu, złamanie tekstu w jego obrębie czy dodanie "szumu". System potrafi też rozpoznać, czy wykryty tekst jest spamem, poprzez porównanie jego sygnatury z zawartymi w bazach danych szablonami niechcianych wiadomości.
- Z jednej strony nasza nowa metoda całkiem dobrze radzi sobie w wykrywaniu obrazów, które zawierają tekst w niemal każdym języku - twierdzi Jewgienij Smirnow, twórca technologii i menedżer ds. rozwoju technologii antyspamowych w Kaspersky Lab. Z drugiej strony, nie próbujemy czytać tekstu przy użyciu rozpoznawania maszynowego, dlatego metoda ta ma (...) niskie wymagania dotyczące zasobów - dodaje.