Spammers. We haten ze allemaal. Hoe meer rommel in onze mailbox, hoe ambetanter we worden.
Maar eigenlijk, aan een kant, bewonder ik ze wel. Als er één iets is wat je van virusschrijvers en spammers kan zeggen, dan is het wel dat ze creatief zijn. En hetzelfde kan gezegd worden van de virus- en spambestrijders van deze wereld.
Voor elk gaatje dat gevonden wordt, heeft een spammer of virusschrijver een antwoord klaar, voor elke nieuwe bedreiging verzinnen de bestrijders een oplossing, en voor elke oplossing zoeken de bandieten weer een nieuw gaatje.
En het is heerlijk en ongemeen boeiend om die creatieve strijd te aanschouwen. Neem nu de spammers. In den beginne was er geen vuiltje aan de lucht, en stuurden ze gewoon mailtjes met reclame voor ‘Viagra’. Gewoon -boenk- het ding bij zijn naam noemen. Dus eerste stap van de bestrijders: het woord ‘Viagra’ is verdacht.
Daarop vonden de spammers het volgende: we vervormen het woord een beetje. We vervangen de ‘i’ door een ‘1’ bijvoorbeeld, of we voegen wat spaties in, of we spreken gewoon over ‘the blue pill’. Dat leverde dus ‘V1AGRA’, ‘VI A GRA’, ‘V.i.a.g.r.a’ en aanverwanten op. Nu, die mogelijkheden zijn niet onuitputtelijk als ze herkenbaar moeten blijven, dus ook daar hadden de bestrijders snel een oplossing voor.
De spammers waren weer aan zet, en die begonnen met afbeeldingen in de mails. Het woord ‘Viagra’ werd niet meer in tekstvorm geschreven, maar werd gewoon in een afbeelding gegoten, zodat de lezer de afbeelding nog ziet en leest, maar een computerprogramma de tekst ‘Viagra’ niet meer zomaar terugvindt. Vandaar dat er nu stilaan spamscanners zijn die aan OCR doen: het “bekijken” van afbeeldingen, en het interpreteren van de letters.
En daar hebben meneer en mevrouw Spam nu blijkbaar een antwoord op gevonden: vanochtend kreeg ik onderstaande mail in mijn postvakje:
Ik weet niet of u direct doorheeft wat er aan de hand is, maar ik vind het geniaal: we hebben niet te maken met een tekst, niet met een afbeelding, maar met een tabel. Een tabel van 31 kolommen en 6 rijen. Alle cellen zijn leeg, maar sommige cellen hebben een achtergrondkleur. En dat geheel geeft een leesbaar woord. De methode leent zich niet echt voor lange woorden, maar toch.
Subliem! Want ik kan niet echt bedenken wat je hiertegen kan doen. Je kan mails met lege tabellen verdacht gaan vinden, maar daar antwoorden de spammers wel weer op door dummy-gegevens in de tabel in te vullen. Je kan een bepaalde grootte van tabellen verdacht vinden, maar daarmee schiet je sommige gelegimiteerde mails met tabelinformatie in de voet. Of je kan software maken die een “foto” neemt van de mail zoals ze te zien is, en daar een OCR-analyse op doet. Wat op zich een heel dure en processor-intensieve oplossing is.
Boeiend dus. Benieuwd hoe de spambestrijders hierop gaan reageren. En chapeau voor de spammers 🙂
Inderdaad subliem. Telkens als je denkt dat ze het eindelijk gevonden hebben om junkmail de wereld uit te helpen, vinden ze weer wat. Tabellen: simpel gevonden, maar inderdaad weer heel moeilijk te kraken. De hamvraag is wat ze binnen enkele maanden gaan vinden in de HTML-taal om hun producten aan de man te brengen. Ze kunnen trouwens ook weer het trucje met die “V1agr@” herhalen, maar dan in die tabelvorm.
En weer is het einde van junkmail wat uitgesteld. Ah ja, het goede nieuws is dat de informatici creatief blijven en er mensen rijk blijven worden met spamfilters. Weer een redelijk crisisbestendige sector :-).