KI für Hate-Speech Erkennung
Neue KI-Methode zur Erkennung von Hassrede und Gegenrede

Forschende der Fachhochschule St. Pölten haben eine neue Methode zur Erkennung und Klassifikation von Hassrede und Gegenrede entwickelt, die neue Maßstäbe in puncto Transparenz und Effizienz setzt. In der kürzlich veröffentlichten hochrangigen Publikation ''Distilling knowledge from large language models: A concept bottleneck model for hate and counter speech recognition'' wird ein neuartiger Ansatz zur Sprachanalyse vorgestellt, der über herkömmliche textbasierte Verfahren hinausgeht.
Die publizierte Methode, Speech Concept Bottleneck Model (SCBM), kombiniert moderne Large Language Models (LLMs) mit menschlich verständlichen Konzepten, die in Kooperation mit Soziologinnen der Universität Wien entwickelt wurden. Diese Konzepte, formuliert als Adjektive (z. B. sexistisch, provokant, liebevoll), erfassen Absicht und Ton von Nachrichten und Social-Media-Beiträgen. LLMs bewerten, wie gut diese Konzepte auf den Inhalt der Nachrichten zutreffen. Auf Grundlage dieser Einschätzungen werden kompakte, transparente KI-Modelle entwickelt, die eine akkurate, nachvollziehbare und ressourcenschonende Klassifikation von Hassrede und Gegenrede ermöglichen. Die Methode ist effizient, schnell und eignet sich für die skalierbare Echtzeitanwendung.
Diese Forschung stellt einen wichtigen Fortschritt im Kampf gegen Online-Hassrede dar und bietet ein leistungsstarkes Werkzeug zur Erkennung von Hassrede und zur Förderung konstruktiver Gegenrede.
Copyright: FH St. Pölten
Die folgenden Autor*innen waren an der Veröffentlichung beteiligt:
- Roberto Labadie-Tamayo (FH St. Pölten)
- Djordje Slijepčević (FH St. Pölten)
- Xihui Chen (FH St. Pölten)
- Adrian Jaques Böck (FH St. Pölten)
- Andreas Babic (FH St. Pölten)
- Liz Freimann (Universität Wien)
- Christiane Atzmüller (Universität Wien)
- Matthias Zeppelzauer (FH St. Pölten)