Einschreibeoptionen
In dieser Vorlesung werden die algorithmischen Aspekte des Data Mining sowie die Programmierung und Einsatz solcher Algorithmen vorgestellt.
Insbesondere gehören dazu folgende Themen: Vorverarbeitung der Daten, Klassifikationstechniken, Regressionsverfahren, Clustering, Zeitreihenanalyse sowie Bayes'sche Netze. Weitere Inhalte umfassen Berechnung und Auswahl der Merkmale (Attribute) und Evaluierung der Ergebnisse.
Ein wesentlicher Teil der Vorlesung wird dem parallelen bzw. verteilten Data Mining gewidmet, u.a. mit dem Map-Reduce Programmiermodell unter Hadoop. Um den Übergang in die Praxis zu erleichtern, werden die Inhalte durch Programme in Matlab / GNU Octave und Java (WEKA) illustriert sowie das Framework KNIME eingeführt.
Insbesondere gehören dazu folgende Themen: Vorverarbeitung der Daten, Klassifikationstechniken, Regressionsverfahren, Clustering, Zeitreihenanalyse sowie Bayes'sche Netze. Weitere Inhalte umfassen Berechnung und Auswahl der Merkmale (Attribute) und Evaluierung der Ergebnisse.
Ein wesentlicher Teil der Vorlesung wird dem parallelen bzw. verteilten Data Mining gewidmet, u.a. mit dem Map-Reduce Programmiermodell unter Hadoop. Um den Übergang in die Praxis zu erleichtern, werden die Inhalte durch Programme in Matlab / GNU Octave und Java (WEKA) illustriert sowie das Framework KNIME eingeführt.