SEISE, en algoritm som upptäcker hackarattacker genom att analysera språket på en webbplats

HACKARE

Vid många tillfällen ser vi hur en webbplats invaderas av hackare som inte tänker lägga ned skadlig programvara så att den inte kan upptäckas av webbläsarnas vanliga verktyg. Det finns inget virus, det finns inget nätfiske, det finns inget enkelt spår kvar av inkräktarna … men attacken har genomförts.

Målet med dessa attacker är enkelt: de inkluderar texter med länkar i olika artiklar, så att en webbplats med god prestige på Internet slutar visa en länk till en webbplats för försäljning av droger eller olagliga apotekare, även om det i andra fall helt enkelt är länkar som pekar till andra webbplatser för att skicka sidrankning.

Det har nu skapats ett nytt verktyg för att identifiera denna typ av åtgärder. Det handlar om algoritmen SEX, skapade för att försvara regeringar och utbildningsinstitutioners webbplatser. Detta system analyserar språket som används i artiklarna på varje webbplats som du vill skydda dig själv och identifierar textstycken som inte följer samma semantiska mönster.

På det här sättet, om en hackare skriver in en text på en webbplats, måste de göra det med en stil, med ett ordförråd och semantik som liknar publiceringsförläggarnas, annars kommer SEISE snabbt att identifiera det.

Vi ser detaljerna på eurekalert.org, där de indikerar att de redan har identifierat 11 000 infekterade webbplatser i .edu, .gov och .mil-domäner över hela världen och arbetar för att utvidga metoden till andra domäner.

Forskningen finansierades av US National Science Foundation. och China Natural Science Foundation. Det kommer att beskrivas i detalj i en presentation den 25 maj på Security and Privacy Symposium i San Jos, Kalifornien.