Entwicklung eines Verfahrens zur Identifikation von Spam-Mail mit künstlichen neuronalen Netzen
Dipl.-Ing. Gerald Weinberger01.02.2009
Abstract
Jährlich verursachen etwa 100 Milliarden Spam-Mails einen enormen wirtschaftlichen Schaden. Derzeit versuchen oft statische Filtermethoden Mails zu klassifizieren, um eine Spam-Filterung durchzuführen. Das in dieser Arbeit entwickelte Verfahren nutzt einen lernenden, dem menschlichen Gehirn nachempfundenen Mechanismus für die Erkennung von Spam: Als Teilgebiet der Neuroinformatik erhält der Softwareentwickler mit einem künstlichen neuronalen Netz ein Werkzeug zur Lösung verschiedenster Aufgaben der Informatik. Für eine Spam-Identifikation wird die Datenmenge (Mail) durch einen Preprozessor aufbereitet und dem neuronalen Netz zur Klassifikation übergeben - wobei unbekannte Datenfragmente einem Trainingsset zugeführt werden. Das neuronale Netz wächst durch erneutes Lernen dieser Trainingsmenge und kann sich somit an sich ändernde Bedingungen anpassen.
Bei den Experimenten stellte sich heraus, dass Netze mit wenigen Neuronen eine eindeutige Klassifizierung von Mails ermöglichen. Größere Netze (ab 2000 Neuronen) führen hingegen zu einem "Verwässern" des Wissens und eine eindeutige Erkennung des Eingabemusters ist nicht mehr möglich. Es bedarf weiterer Maßnahmen um das Verfahren zu optimieren.
ISBN: 386815261X
Download (PDF):
Kurzfassung_Entwicklung_eines_Verfahrens.pdf
—
PDF document,
46Kb
Abstract_Entwicklung_eines_Verfahrens.pdf
—
PDF document,
45Kb
<< Zurück

