6. Data Science Journal Club

Der 6. Data Science Journal Club im Zeichen von Crossover Data Compression

Einmal im Monat werden wichtige wissenschaftliche Arbeiten aus dem Feld der Data Science und Artificial Intelligence (AI) vorgestellt, wobei stets auch der praktische Nutzen für unsere eigene Lehre und Forschung im Mittelpunkt steht.

Hubert Schölnast, Junior Researcher in der Forschungsgruppe Data Intelligence des Instituts für IT Sicherheitsforschung, präsentiert seine Arbeit 'Crossover Data Compression'.  Im Vortrag wird zuerst die grundlegende Idee völlig technik-frei anhand einer Analogie erklärt, anschließend wird anhand zweier Beispiele gezeigt, was in den Black Boxes wirklich vor sich geht. Es folgen drei Beispiele, bei denen das Verfahren bereits erfolgreich eingesetzt worden ist. Den Abschluss bildet ein Einblick in die noch offenen Forschungsfragen, die Hubert Schölnast im Zuge seiner Dissertation beantworten will.

Kurzbeschreibung

Die CDC ist eine neue Methode, mit der es möglich ist, den Grad der Unterschiedlichkeit zweier Zeichenketten, Dateien usw. festzustellen. Jede Datei wird als Zeichenkette interpretiert, die durch einen Sequitur-ähnlichen Algorithmus komprimiert wird. Dabei fallen das eigentliche Komprimat und ein Satz von Ersetzungsregeln getrennt voneinander an. Diese Regeln kann man nun verwenden, um andere Zeichenketten zu komprimieren, so als würde man aus einer Orange Zitronensaft pressen. Das Ergebnis ist aber nicht optimal. Die komprimierte Datei ist etwas größer, und zwar ist sie umso größer, je schlechter die verwendeten Regeln zum Aufbau der Zeichenkette passen. Diese Abweichung vom Optimum gibt also an, wie ähnlich sich die beiden Dateien sind.

Diskussion bei virtuellem Kaffe und Kuchen

Im Anschluss an die Online-Präsentation wünschen wir uns bei virtuellem Kaffee und Kuchen eine lebhafte Diskussion zu dem Thema.

Der 6. Data Science Journal Club findet am 25. Juni 2021 von 11:00 bis 12:00 Uhr statt. Kommen Sie vorbei! Der virtuelle Eintritt ist kostenfrei und für alle Interessierten zugänglich.

So sind Sie dabei

Klicken Sie bitte ein paar Minuten vor Beginn auf den Link: 

Der Termin findet über das Online-Tool MS Teams statt. Hier finden Sie die Datenschutzbestimmungen von MS Teams.

Sie wollen mehr wissen? Fragen Sie nach!
Dr. Adrowitzer Alexander

Dr. Alexander Adrowitzer

FH-Dozent Stellvertretender Studiengangsleiter Data Science and Business Analytics (BA) Department Informatik und Security