3 min

Deepfakes und wie sie erstellt werden

Deepfakes und wie sie erstellt werden

Alexander Buchelt

Student Ambassador für Data Intelligence berichtet

Sylvester Stallone als Terminator, Salvador Dalí, der eine Führung durch seine eigene Ausstellung in einem Museum macht oder Shaquille O’Neal, der „Take on me!“ von Aha! singt. Jeder kennt mittlerweile Beispiele für diese überzeugend echt wirkenden Videos. Aber was dahinter steckt ist oft noch nicht so bekannt. Es geht um Deepfakes!

Was sind Deepfakes?

Deepfakes sind Videos, in denen das Gesicht der ursprünglich zu sehenden Person durch das einer anderen Person ersetzt wird. Dies funktioniert so, dass man eine KI (= Künstliche Intelligenz) drauf trainiert, das Zielgesicht zu rekonstruieren. Die KI lernt markante Punkte und Strukturen des Gesichts und erstellt so ein Muster. Mit diesem Muster ist sie in der Lage, ein Foto auf das gelernte Gesicht umzuwandeln. Je besser die KI trainiert ist, desto überzeugender werden hier die Ergebnisse.

Wie einfach ist es, Deepfakes zu erstellen?

Grundsätzlich sind Deepfakes mittlerweile sehr leicht zu erstellen. Es gibt hierfür Apps für das Smartphone oder fertige Anwendungen für den PC. Bei diesen Anwendungen ist aber die Qualität nicht unbedingt immer gut oder es wird Domänenwissen in der Verwendung verlangt. Wir wollten diese Lücke schließen und zeigen, dass es auch möglich sein kann, ohne diese Faktoren gute Videos zu faken.

Daher hatten es sich meine Kolleg*innen und ich bei unserem Projekt im Rahmen unseres Bachelorstudiums in Data Science und Business Analytics zum Ziel gesetzt, eine Anwendung zu erstellen, die kaum Vorwissen und kaum Eigenaufwand von Benutzer*innen verlangt, um einen Deepfake zu erstellen. Unser erklärtes Ziel war es, hier einen Deepfake von unserer Studiengangsleiterin Marlies Temper zu erstellen, bei dem wir sie statt Angela Merkel im Bundestag eine Rede halten lassen. Ob und wie gut uns das gelungen ist, zeige ich noch später in diesem Artikel.

Die Anwendung

Am Anfang eines jeden Deepfakes steht Bildmaterial. Ohne genügend Bilder kann man keine KI trainieren, um Videos rekonstruieren zu können. Ein wichtiger Punkt hierbei ist natürlich auch die Qualität dieser Bilder.

Der einfachste Weg, um an Bilder zu kommen, ist, ein Video von der gewünschten Person zu nehmen und dieses Frame für Frame zu Bildern zu konvertieren. Für unsere Anwendung haben wir uns daher dazu entschlossen, Videos sowohl von YouTube und Instagram zu nehmen, da die Nutzungsbedingungen dieser Plattformen eine Verwendung erlauben, solange diese nicht für kommerzielle Zwecke ist.

Nachdem unser Anspruch ein „fire and forget“ Ansatz war, haben wir dieses Problem gelöst, indem wir einen Webscraper entwickelt haben, der zwei Namen erhält und Videos in einer bestimmten Mindestqualität von den zuvor erwähnten Plattformen lädt.

Die Videos werden dann Frame für Frame zu Bildern gemacht, und eine auf die gewünschten Gesichter trainierte Gesichtserkennung wird verwendet, um das Bildmaterial automatisch zu säubern. Die gesäuberten Trainingsdaten werden dann automatisch an eine Version der bestehenden Anwendung „Deepfake“, die einem - nachdem hier die Netze schon programmiert sind - das Erstellen der KI abnimmt. So wird der Deepfake trainiert und erstellt.

Um die Frage des Erfolgs zu beantworten habe ich hier ein Bild vorbereitet.

Blog Alex

Ich würde behaupten, dass uns das ziemlich gut gelungen ist. Natürlich erkennt man bei genauem Hinsehen, dass es sich hier um einen Fake handelt. Wir haben dennoch eine Anwendung erstellt bei der Benutzer*innen nur zwei Namen angeben müssen und zwei Tage später – ja, es dauert tatsächlich so lange ein gutes Ergebnis zu trainieren - einen relativ guten Deepfake generiert haben.

Wieso ist dieses Thema wichtig?

In Zeiten der „Fake News“ wird auch das Thema Deepfakes immer präsenter. So könnte man zum Beispiel Personen der Öffentlichkeit Dinge tun oder sagen lassen, die sie nie getan oder gesagt haben. Deepfakes bieten somit ein starkes Werkzeug, um falsifizierte Medien zu erstellen. Aus diesem Grund wollten meine Kollegen und ich zeigen, dass es leicht möglich ist, diese auch für die breite Masse zugänglich zu machen.

Wir haben dieses Projekt im Rahmen unseres Bachelorstudiums gemacht, aber auch im Master Data Intelligence, in dem ich mich mittlerweile befinde gehören die Techniken, die hier im Hintergrund stehen und die ethischen Implikationen, die damit einher gehen zu den zentralen Themen die gelehrt werden.