Banner Viadrina

International Business Administration

Machine Learning mit R

Modulbezeichnung in Englisch: Machine Learning with R

Prüfungsnummer: 6794

Semester: ab 1. Semester

Dauer des Moduls: Ein Semester

Art des Moduls (Pflicht, Wahl, etc.): Wahlpflicht

Häufigkeit des Angebots des Moduls: Wintersemester 2017/2018, Wintersemester 2018/2019

Zugangsvoraussetzungen: Grundkenntnisse in Statistik und der Programmiersprache R. Wir empfehlen, den Kurs "Analyse von Finanzmarktdaten in R" besucht und erfolgreich abgeschlossen zu haben. Eine gleichzeitige Anrechnung dieses Kurses mit "Analyse von Finanzmarktdaten mit R II" aus dem WS 2017/18 ist nicht möglich, da beide Kurse inhaltsgleich sind.

Verwendbarkeit des Moduls für andere Studiengänge:
Pflicht- bzw. Wahlmodul für andere Studiengänge. Das Nähere regeln die Bestimmungen des entsprechenden Studiengangs.

Modulverantwortlicher/Modulverantwortliche: Prof. Dr. Sven Husmann

Name der/des Hochschullehrer/s: Prof. Dr. Sven Husmann

Lehrsprache: Deutsch

Zahl der zugeteilten ECTS-Credits: 6

Gesamtworkload und ihre Zusammensetzung (z.B. Selbststudium + Kontaktzeit):
Kontaktzeit (Vorlesung, Übung etc.): 45 Std.; Selbststudium: 135 Std.

Lehrveranstaltungsstunden (LVS): 3

Art der Prüfung/ Voraussetzung für die Vergabe von Leistungspunkten:
Erfolgreiche Teilnahme an einer 120-minütigen computerbasierten Klausur.

Gewichtung der Note in der Gesamtnote: Regeln die Bestimmungen des entsprechenden Studiengangs

Qualifikationsziele des Moduls:
Die Prognose von Daten ist in der Praxis für viele ökonomische Akteure ein zentrales Anliegen, beispielsweise die Prognose künftiger Aktienrenditen auf der Basis von aktuellen Unternehmens- und Kapitalmarktdaten oder die Prognose von Ausfallrisiken für Kredite auf der Grundlage von personenbezogenen Daten wie Alter, Beruf und Wohnort. Im Modul Machine Learning lernen Sie allgemein, wie man mit statistischen Methoden nach strukturellen Zusammenhängen (Modellen) in historischen Datensätzen sucht, zum Beispiel nach dem Einfluss von Alter, Beruf und Wohnort (Inputs) auf die Ausfallrisiken von Krediten (Outputs). Dabei sind wir insbesondere an solchen Modellen interessiert, die zu einer möglichst guten Prognose von Outputs führen, wenn man die geschätzten Modelle auf neue Inputs anwendet. Unter idealen Bedingungen können Sie dieses Problem mit einer klassischen OLS-Regression am besten lösen. Leider sind diese idealen Bedingungen in der Praxis oft nicht gegeben. Insbesondere sind gerade in den letzten Jahren häufig große Datenmengen verfügbar (Big Data), die strukturellen Zusammenhänge in diesen Daten aber nur vage oder gar nicht bekannt. Das kann dazu führen, man mit hinreichend komplexen Modellen zwar scheinbare Zusammenhänge in historischen Daten „entdeckt“ (Data Mining), die Modelle sich für Prognosen aber als vollkommen ungeeignet erweisen. Mit den Methoden des Machine Learning (auch Statistical Learning genannt) können Sie sich in diesem Modul ein praktisch nutzbares Instrumentarium aneignen, mit dem Sie auch auf der Basis von großen Datenmengen mit unbekannten strukturellen Zusammenhängen möglichst gute Prognosen erstellen können.

Inhalte des Moduls:
- Bias-Variance Tradeoff
- Penalized Regression: Ridge, Lasso, Elastic Net
- Cross-Validation, IC-basierte Methoden
- Neural Networks: Erzeugung, Training, Regularisierung

Lehr- und Lernmethoden des Moduls:
Vorlesungen und Übungen.

Besonderes (z.B. Online-Anteil, Praxisbesuch, Gastvorträge, etc.):
Videovorlesungen, Online-Sprechstunden zu den Videovorlesungen, Übungen im Computerraum.

Literatur (Pflichtlektüre/zusätzlich empfohlene Literatur):
Literaturempfehlungen werden in Moodle bekannt gegeben.

Weitere Informationen:
Registrierung in Moodle Viadrina erforderlich.