Banner Viadrina

International Business Administration

Machine Learning mit R

Name of module in english: Machine Learning with R

Exam number: 6794

Semester: ab 1. Semester

Duration of the module: Ein Semester

Form of the module (i.e. obligatory, elective etc.): Wahlpflicht

Frequency of module offer: Alle ein bis zwei Semester

Prerequisites: Grundkenntnisse in Statistik und der Programmiersprache R. Wir empfehlen, den Kurs "Analyse von Finanzmarktdaten in R" besucht und erfolgreich abgeschlossen zu haben. Eine gleichzeitige Anrechnung dieses Kurses mit "Analyse von Finanzmarktdaten mit R II" aus dem WS 2017/18 ist nicht möglich, da beide Kurse inhaltsgleich sind.

Applicability of module for other study programmes:
Pflicht- bzw. Wahlmodul für andere Studiengänge. Das Nähere regeln die Bestimmungen des entsprechenden Studiengangs.

Person responsible for module: Prof. Dr. Sven Husmann

Name of the professor: Prof. Dr. Sven Husmann

Language of teaching: Deutsch

ECTS-Credits (based on the workload): 6

Workload and its composition (self-study, contact time):
Kontaktzeit (Vorlesung, Übung etc.): 45 Std.; Selbststudium: 135 Std.

Contact hours (per week in semester): 3

Methods and duration of examination:
20-minütige mündliche Prüfung und Anfertigung einer häuslichen Prüfungsleistung.

Emphasis of the grade for the final grade: Regeln die Bestimmungen des entsprechenden Studiengangs

Aim of the module (expected learning outcomes and competencies to be acquired):
Die Prognose von Daten ist in der Praxis für viele ökonomische Akteure ein zentrales Anliegen, beispielsweise die Prognose künftiger Aktienrenditen auf der Basis von aktuellen Unternehmens- und Kapitalmarktdaten oder die Prognose von Ausfallrisiken für Kredite auf der Grundlage von personenbezogenen Daten wie Alter, Beruf und Wohnort. Im Modul Machine Learning lernen Sie allgemein, wie man mit statistischen Methoden nach strukturellen Zusammenhängen (Modellen) in historischen Datensätzen sucht, zum Beispiel nach dem Einfluss von Alter, Beruf und Wohnort (Inputs) auf die Ausfallrisiken von Krediten (Outputs). Dabei sind wir insbesondere an solchen Modellen interessiert, die zu einer möglichst guten Prognose von Outputs führen, wenn man die geschätzten Modelle auf neue Inputs anwendet. Unter idealen Bedingungen können Sie dieses Problem mit einer klassischen OLS-Regression am besten lösen. Leider sind diese idealen Bedingungen in der Praxis oft nicht gegeben. Insbesondere sind gerade in den letzten Jahren häufig große Datenmengen verfügbar (Big Data), die strukturellen Zusammenhänge in diesen Daten aber nur vage oder gar nicht bekannt. Das kann dazu führen, man mit hinreichend komplexen Modellen zwar scheinbare Zusammenhänge in historischen Daten „entdeckt“ (Data Mining), die Modelle sich für Prognosen aber als vollkommen ungeeignet erweisen. Mit den Methoden des Machine Learning (auch Statistical Learning genannt) können Sie sich in diesem Modul ein praktisch nutzbares Instrumentarium aneignen, mit dem Sie auch auf der Basis von großen Datenmengen mit unbekannten strukturellen Zusammenhängen möglichst gute Prognosen erstellen können.

Contents of the module:
- Bias-Variance Tradeoff
- Penalized Regression: Ridge, Lasso, Elastic Net
- Cross-Validation, IC-basierte Methoden
- Neural Networks: Erzeugung, Training, Regularisierung

Teaching and learning methods:
Vorlesungen und Übungen.

Special features (e.g. percentage of online-work, practice, guest speaker, etc.):
Videovorlesungen, Online-Sprechstunden zu den Videovorlesungen, Übungen im Computerraum.

Literature (compulsory reading, recommended literature):
Literaturempfehlungen werden in Moodle bekannt gegeben.

Further information:
Registration in Moodle Viadrina required.