Trotz SpamAssassin und Bayesschen Filtern ärgert sich ein gewöhnlicher E-Mail-Nutzer ständing über Spam. Mails lesen heisst zuerst einmal, den Spam als solchen zu erkennen und auszusortieren. Diese Arbeit macht keinen Spass. Damit ist eine wichtige Bedingung erfüllt, um sie dem Computer zu überlassen.
Der Vortrag beschäftigt sich mit einem rel. neuen Ansatz, natürlichsprachliche Texte automatisch in die Klassen erwuenscht/unerwuenscht einzuteilen. Dabei soll von von einigen Hintergrundinformationen über die verwendeten Support Vector Machines bis hin zu einer experimentellen Anwendung im Mailsystem des Autors ein Überblick gegeben werden, wie man solch eine Aufgabe unter Linux angehen kann.