Introduction to Data Science and Machine Learning

Allgemeine Informationen zur Lehrveranstaltung

Dozent                              Prof. Dr.-Ing. habil. Yousef Heider

                                           E-Mail: yousef.heider[at]uni-kassel[dot]de

                                           Tel.: +49 561 804-2831

 

Vorlesungzeiten              Vorlesung: Di. 10:00 Uhr - 14:00 Uhr, Diagonale 1, Hörsaal 1 (Raum 0603)

und Ort                              Übung: Do. 8:00 Uhr - 10:00 Uhr, Möncheberg 7, Raum 2400


Lernziel

Die Studierenden überblicken grundsätzliche Konzepte des Umgangs mit Daten, der datenbasierten Modellierung sowie der Identifikation von Modellparametern durch lernbasierte Strategien.

Sie haben Ihre Kenntnisse im Bereich der linearen Algebra vertieft. Hierauf aufbauend haben sie wichtige Methoden zur Analyse und Dimensionsreduktion von Daten kennengelernt und können diese Methoden für grundsätzliche Datenanalysen anwenden. Sie haben darüber hinaus Grundlagen der Stochastik kennengelernt und können diese zur Datenanalyse einsetzen. Darüber hinaus verstehen sie insbesondere die Grundzüge der Bayes'schen Statistik und deren Anwendung im Zusammenhang mit maschinellem Lernen.

Aufbauend auf diesen Grundlagen haben sie elementare Methoden der Klassifikation sowie Regression kennengelernt und kennen grundlegende Begriffe zu Neuralen Netzen.

Im Rahmen der Veranstaltung haben die Studierenden Grundlagen zur Datenanalyse sowie zum Maschinellen Lernen erworben. Sie können auf dieser Basis Vor- und Nachteile unterschiedlicher Ansätze beurteilen und problemabhängige geeignete Klassen von Ansätzen auswählen. Das Gelernte ist eine Basis für weiterführende Veranstaltungen in diesem Themengebiet.


Inhalte

  • Einführung  
       - Daten, Modelle  
       - Lernen (überwacht / nicht überwacht)
  • Grundlagen der Stochastik  
       - Grundbegriffe (Zufallsvariable, Verteilung, Verteilungsdichte,...)  
       - Momente  
       - Rechenregeln  
       - Normalverteilung  
       - Satz von Bayes
  • Lineare Algebra und Daten  
       - Eigenwertanalyse: Hauptachsentransformation, Kovarianzmatrix,...  
       - PCA / SVD  
       - Niedrigrangapproximation
  • Klassifikation  
       - Dichtebasierte Verfahren (k-means)  
       - Hierarchische Clusteranalyse (Dendrogram)
  • Lineare Regression  
       - Least-Squares-Verfahren  
       - Maximum Likelihood
  • Neuronale Netze  
       - Grundlagen  
       - einlagige Netze zur Funktionsapproximation  
       - Perzeptron (einlagig, XOR-Problem, hiddenlayer)  
       - Lernen (re-inforcement, back-propagation)

Vorlesungsmaterial

Das Vorlesungsmaterial wird in moodle zur Verfügung gestellt. 


Schriftum

  • Deisenroth, Faisal, Ong: "Mathematics for Machine Learning", Cambridge University Press, 2020
  • Strang: "Linear Algebra and Learning from Data", Wellesley Cambridge Press, 2019
  • Bishop: "Pattern Recognition and Machine Learning", Springer, 2006
  • Goodfellow, Bengio, Courville: "Deep Learning", The MIT Press, 2016
  • Kroll: "Computational Intelligence", de Gruyter, 2016
  • Fröchte: "Maschinelles Lernen", Hanser, 2021

Voraussetzungen (Empfehlung)

  • Mathematik 1-3  
  • Grundlagen der Informatik - Einführung in die Programmierung  
  • Modellierung und Simulation
     

Leistungsnachweis

  • Klausur