Beschreibung einzelner Lerneinheiten (ECTS-Lehrveranstaltungsbeschreibungen) pro Semester

  
Studiengang:Master Nachhaltige Energiesysteme
Studiengangsart:FH-Masterstudiengang
 Berufsbegleitend
 Sommersemester 2025
  

Titel der Lehrveranstaltung / des ModulsData Science
Kennzahl der Lehrveranstaltung / des Moduls072722020301
UnterrichtsspracheDeutsch
Art der Lehrveranstaltung (Pflichtfach, Wahlfach)Pflichtfach
Semester in dem die Lehrveranstaltung angeboten wirdSommersemester 2025
Semesterwochenstunden2
Studienjahr2025
Niveau der Lehrveranstaltung / des Moduls laut Lehrplan2. Zyklus (Master)
Anzahl der zugewiesenen ECTS-Credits3
Name des/der VortragendenElias EDER
Valentin SEILER


Voraussetzungen und Begleitbedingungen

Keine

Lehrinhalte

Die Lehrveranstaltung vermittelt die klassichen Tools der Datenanalyse. Es werden die statistischen und methodischen Grundlagen erläutert, sowie die Tools in einer Programmierumgebung an Beispielen angewandt.

  • Datenstrukturen: Samples, Features, Target
  • Statistische Grundlagen: (Co-)Varianz, Korrelation, statistischer Zusammenhang vs. Kausalität
  • Cross Validation: Lern- und Testdatensätze, Fit und Prognose
  • Supervised Learning: Regression vs. Klassifikation, k-Nearest Neighbors, Lineare und Logistische Regression, Linear Support Vector Machines, (Ensembles von) Decision Trees
  • Unsupervised Learning: Clustering, Scaling
  • Tools: Datentransformationen, Dummies, Feature Selection, Regularisierung, Grid Search
Lernergebnisse

Die Studierenden erwerben grundlegende Kenntnisse und Anwendungskompetenz in den klassischen Tools der Datenanalyse. Die Studierenden

  • können zwischen statistischem Zusammenhang und Kausalität unterscheiden.
  • sind in der Lage Zusammenhänge in Daten zu finden, grafisch darzustellen, quantitativ zu bewerten. Sie können Fits und Prognosen auf Basis verschiedener Modelle erstellen.
  • verstehen die lineare Regression und sind fähig mehrdimensionale Regressionen durchzuführen und die Ergebnisse korrekt zu interpretieren.
  • verstehen weitere klassische Tools wie k-Nearest Neighbors, Clustering und Decision Trees. Sie können diese anwenden und deren Ergebnisse interpretieren.
  • können mittels Cross Validation die Güte und Robustheit ihrer Modellaussagen bewerten.
Geplante Lernaktivitäten und Lehrmethoden
  • Vorlesungen
  • Programmierübungen, Programmierprojekte
  • Coaching
Prüfungsmethode und Beurteilungskriterien
  • Schriftliche Prüfung zur Theorie (30%)
  • Projekt inklusive Präsentation und mündlicher Abschlussprüfung (70%)

Für eine positive Gesamtnote müssen insgesamt mindestens 50% der Punkte erzielt werden.

Kommentar

Keiner

Empfohlene Fachliteratur und andere Lernressourcen
  • Guido, Sarah; Müller, Andreas C. (2016): Introduction to Machine Learning with Python: A Guide for Data Scientists. Sebastopol, CA: O’Reilly UK Ltd.
  • VanderPlas, Jake (2016): Python Data Science Handbook: Essential Tools for working with Data. Sebastopol, CA: O’Reilly UK Ltd.
  • Géron, Aurélien (2019): Hands-on Machine Learning with Scikit-Learn, Keras, and TensorFlow: Concepts, Tools, and Techniques to Build Intelligent Systems. 2nd ed. O’Reilly UK Ltd.
  • McKinney, Wes (2017): Python for Data Analysis: Data Wrangling with Pandas, NumPy, and IPython. 2nd edition. Sebastopol, California: O’Reilly UK Ltd.
  • Provost, Foster; Fawcett, Tom (2013): Data Science for Business: What you need to know about data mining and data-analytic thinking. O’Reilly and Associates.
Art der Vermittlung

Präsenzveranstaltung. Die Studierenden werden vor Beginn der Lehrveranstaltung über die Anwesenheitsvorgaben der Lehrbeauftragten informiert.






Sommersemester 2025an den Anfang