Forschungsgruppe Network Security
(Prof. Dr. Heer)

Design und Weiterentwicklung des Privacy Assistants

Studienprojekt
Verfügbar

Große Websites, wie die der Hochschule Esslingen, bestehen aus vielen Unterseiten mit einer großen Menge an Informationen. In der Regel hat niemand einen Überblick, welche Informationen dort überhaupt zu finden sind oder die Websites werden von einer großen Zahl an Personen administriert. Folglich kann nicht sichergestellt werden, dass keine personenbezogenen Daten ungewollt veröffentlicht wurden.

In der heutigen Zeit und mit den heutigen Datenschutzgesetzen ist es allerdings das Ziel, so wenige personenbezogenen Daten wie möglich zu verbreiten. Daher wurde der Privacy Assistant entwickelt, dessen Ziel es ist, Websites auf personenbezogene Daten zu scannen. Die Ergebnisse des Scans, d.h. die gefunden personenbezogenen Daten werden übersichtlich in einer Webanwendung dargestellt, um diese bewerten zu können. Die Bewertung ermöglicht es, zu bewerten, ob es sich um gewollt veröffentlichte personenbezogene Daten handelt oder sogar um ein false positive. Somit ermöglicht der Privacy Assistant eine einfache Untersuchung einer Website auf personenbezogene Daten.

Obwohl die Entwicklung des Privacy Assistants inzwischen gut vorangekommen ist, fehlen weiterhin wichtige Funktionen, die wünschenswert wären, um das Tool produktiv einzusetzen und sogar unter Open-Source-Lizenz zu veröffentlichen. Zum Beispiel müssen wir darauf achten, dass der Privacy Assistant nicht selbst durch die Speicherung personenbezogener Daten existierende Datenschutzgesetze verletzt. Außerdem sollte der Scan umfangreicher konfigurierbar sein, um die Suche nach speziellen personenbezogenen Daten, z.B. Matrikelnummern, zu erweitern und um die Suche in Dateien, wie PDFs, zu ermöglichen.

Aufgabe und Fragestellungen

Im folgenden finden sich einige Ideen zur Weiterentwicklung des Privacy Assistants:

  • Entwicklung einer Technologie, um Funde von personenbezogenen Daten dem Nutzer anzuzeigen ohne diese selbst zu speichern
  • Erweiterung des Scrapers um einen frei konfigurierbaren Filter für den Scan nach benutzerdefinierten personenbezogenen Daten (nicht nur vorgegebene Filter, wie Namen und BIlder)
  • Durchsuchung von Dateien, z.B. PDF und DOCX
  • Nutzung von Machine Learning zum Auswerten der Ergebnisse

Anforderungen

  • Programmiererfahrung in Python und JavaScript/TypeScript
  • Kenntnisse im Bereich Internettechnologien (z.B. HTTP)
  • Interesse an Datenschutz

Bearbeitet von

  • Daniel Hartung
  • Andreas Kolb
  • Maximilian Fink

Dateien

Kontakt