Knowledge Discovery & Visual Data Mining

Pedestrian & Bicycle crashes in the region of Chapel Hill: Are there more crashes at a specific time of the day? (with map)
  • Pedestrian & Bicycle crashes in the region of Chapel Hill: Where do the crashes took place?
    Pedestrian & Bicycle crashes in the region of Chapel Hill: Where do the crashes took place?

Knowledge Discovery & Visual Data Mining – A Case Study for Master’s Degree Modules with D3.js using the example of Pedestrian and Bicycle Crash Data in the Region of Chapel Hill

Meine Masterarbeit befasst sich mit dem Prozess des Knowledge Discovery & Visual Data Mining. Sie enthält eine Fallstudie für Kurse eines Master-Studiums. Diese Fallstudie zielt darauf ab, Studenten zu befähigen den Prozess mit d3.js durchzuführen, der in einer Website resultiert. Dazu werden Datensätze von Fußgängern- (vgl. Town of Chapel Hill, 2016b) und Fahrrad-Unfalldaten (vgl. Town of Chapel Hill, 2016a) in der Region Chapel Hill als Datenquellen für die Fallstudie verwendet (verschiedenste aktuelle Daten aus Chapel Hill können hier gefunden werden: Town of Chapel Hill Open Data portal ).

Für die Erläuterung des Prozesses werden die Begriffe Knowledge Discovery from Data, (Visual) Data Mining, Data, und Attributes definiert. Außerdem werden verschiedene Attributtypen, Diagrammtypen und Prozessmodelle beschrieben. Insbesondere wird das CRISP-DM wird genauer beschrieben, da es an die Bedürfnisse der Fallstudie angepasst ist.

Die Fallstudie selbst besteht aus zwölf Schritten und einem Zwischenschritt innerhalb von sechs definierten Phasen, um elf Ziele zu erreichen. Diese Ziele werden während der Schritte der Fallstudie definiert. Die Studenten können diesen Prozess Schritt für Schritt nachvollziehen. Außerdem wird während der Fallstudie detailliert erklärt, wie Diagramme mit JavaScript und d3.js erstellt werden können. Daher können die Studenten den Programmiercode für die Diagramme, die ihnen gefallen, verwenden und an ihre eigenen Projekte anpassen.

Außerdem wird d3.js mit R und Shiny verglichen, um zu erklären, wann man welches dieser beiden Werkzeuge sinnvoll einsetzt. Am Ende dieser Master Thesis gibt es eine kritische Betrachtung dieser Arbeit, sowie einige weitere Forschungsmöglichkeiten.

Hier kann die Master-Arbeit, sowie die zugehörige Kolloquiumspräsentation gerne eingesehen werden:

Master-Arbeit

Kolloquium-Präsentation