Auswirkungen von künstlichen neuronalen Netzen auf CAPTCHA-Systeme

Bachelor Studiengang IT Security

David Prohaska, BSc

Betreuer: Dr. Markus Huber, MSc

Ausgangslage

Durch immer effektivere Algorithmen im Bereich der künstlichen Intelligenz geraten Verfahren zur Unterscheidung von Mensch und Computer in Gefahr. Ein solches Verfahren ist unter dem Begriff CAPTCHA (Completely Automated Public Turing test to tell Computers and Humans Apart) bekannt und stellt Aufgaben, die nur von Menschen gelöst werden können, womit Computer ausgesperrt werden. Während anfangs das visuelle Sehen sowie die Spracherkennung für Computer eine Hürde darstellte, zeigt nun ein Zweig der künstlichen Intelligenz, die künstlichen neuronalen Netze, eine sehr hohe Erfolgsrate beim Überlisten von CAPTCHAs.

Ziel

Aus diesem Grund geht diese Arbeit auf die Frage nach den Auswirkungen von künstlichen neuronalen Netzen auf die automatisierte Lösbarkeit von CAPTCHAs ein. Hierfür wird zunächst auf ein breites Spektrum gängiger CAPTCHAs, automatisierte Lösungen von kommerziellen AnbieterInnen sowie Erfolgsraten von künstlichen neuronalen Netzen bei der Lösung von CAPTCHAs eingegangen.

Ergebnis

Bei der Untersuchung von Rubriken populärer Webseiten, Sharehoster und E-Mail-Provider wurden 73 CAPTCHAs gefunden. Bei 37 davon handelt es sich um Googles reCAPTCHA, was dieses zum am häufigsten verwendeten CAPTCHA macht. Alle 73 CAPTCHAs können mit Hilfe kommerzieller Anbieter zur Erkennung von CAPTCHAs gelöst werden. Nachdem Googles reCAPTCHA-System gängig ist, wurde ein automatisierter Angriff durch künstliche neuronale Netze, die Autos erkennen können, durchgeführt. 35,8 Prozent der insgesamt 1.000 Aufgaben, die die bildbasierte reCAPTCHA-Version stellte und in denen das Auswählen von Bildern, die Autos zeigen, erwartet wurde, konnten automatisiert gelöst werden. Dieser Angriff konnte durchgeführt werden, da in reCAPTCHA kein Limit für das neue Anfordern von Aufgaben gesetzt ist. Somit können schwerere Aufgaben einfach übersprungen werden oder ein künstliches neuronales Netz kann nur auf eine bestimmte Aufgabe trainiert werden. Während Autos nur eine mögliche Kategorie darstellen, lassen sich künstliche neuronale Netze auch auf weitere Kategorien trainieren. Dies führt zum dem Schluss, dass das reine Erkennen von Bildern in CAPTCHA-Systemen nicht mehr dem Stand der Technik entspricht, nachdem dies keine Hürde für das automatisierte Lösen durch Computer darstellt. Für die Zukunft wird eine neue Form von Aufgaben benötigt.