Universität Wien
Achtung! Das Lehrangebot ist noch nicht vollständig und wird bis Semesterbeginn laufend ergänzt.

052813 VU Scientific Data Management (2021S)

Prüfungsimmanente Lehrveranstaltung

An/Abmeldung

Hinweis: Ihr Anmeldezeitpunkt innerhalb der Frist hat keine Auswirkungen auf die Platzvergabe (kein "first come, first served").

Details

max. 25 Teilnehmer*innen
Sprache: Englisch

Lehrende

Termine (iCal) - nächster Termin ist mit N markiert

Die Lehrveranstaltung wird bis auf weiteres online stattfinden.

  • Dienstag 02.03. 15:00 - 16:30 Digital
  • Donnerstag 04.03. 08:00 - 09:30 Digital
  • Dienstag 09.03. 15:00 - 16:30 Digital
  • Donnerstag 11.03. 08:00 - 09:30 Digital
  • Dienstag 16.03. 15:00 - 16:30 Digital
  • Donnerstag 18.03. 08:00 - 09:30 Digital
  • Dienstag 23.03. 15:00 - 16:30 Digital
  • Donnerstag 25.03. 08:00 - 09:30 Digital
  • Dienstag 13.04. 15:00 - 16:30 Digital
  • Donnerstag 15.04. 08:00 - 09:30 Digital
  • Dienstag 20.04. 15:00 - 16:30 Digital
  • Donnerstag 22.04. 08:00 - 09:30 Digital
  • Dienstag 27.04. 15:00 - 16:30 Digital
  • Donnerstag 29.04. 08:00 - 09:30 Digital
  • Dienstag 04.05. 15:00 - 16:30 Digital
  • Donnerstag 06.05. 08:00 - 09:30 Digital
  • Dienstag 11.05. 15:00 - 16:30 Digital
  • Dienstag 18.05. 15:00 - 16:30 Digital
  • Donnerstag 20.05. 08:00 - 09:30 Digital
  • Donnerstag 27.05. 08:00 - 09:30 Digital
  • Dienstag 01.06. 15:00 - 16:30 Digital
  • Dienstag 08.06. 15:00 - 16:30 Digital
  • Donnerstag 10.06. 08:00 - 09:30 Digital
  • Dienstag 15.06. 15:00 - 16:30 Digital
  • Donnerstag 17.06. 08:00 - 09:30 Digital
  • Dienstag 22.06. 15:00 - 16:30 Digital
  • Donnerstag 24.06. 08:00 - 09:30 Digital
  • Dienstag 29.06. 15:00 - 16:30 Digital

Information

Ziele, Inhalte und Methode der Lehrveranstaltung

Die Veranstaltung vermittelt zentrale Methoden für die Organisation und Analyse von großen wissenschaftlichen Datenbeständen: Verteilte Datenrepositories, Index- und Zugriffstrukturen, Hashing, Klassifikations- und Clusteringtechniken. Es werden spezielle Verfahren für strukturierte Daten wie Mengen, Bilder, Dokumente und Graphen behandelt. In Programmierübungen lernen die Studierenden effiziente Verfahren für die Ähnlichkeitssuche und das Data-Mining auf großen Datenmengen kennen z.B. Parallelisierung (MapReduce, SPARK) und Filter-Verifikations-Techniken.

Fachliche Ziele
- Wissenschaftliche Daten analysieren
- Ergebnisse der Analyse interpretieren und bewerten
- Techniken für strukturierte Daten auswählen und anwenden
- Skalierbare Lösungen für große Datenmengen auswählen und implementieren
- Anwender unterstützen und beraten

Überfachliche Ziele
- Teamarbeit
- Verbesserung der Programmierkenntnisse
- Verständnis für Zusammenspiel von Datenanalyse und Scientific Computing

Art der Leistungskontrolle und erlaubte Hilfsmittel

Aktive Mitarbeit
Bearbeitung von Übungsblättern
Bearbeitung von Programmieraufgaben in Gruppen
Abschlusstest

Mindestanforderungen und Beurteilungsmaßstab

Es wird empfohlen, dass die folgenden Kurse vor dieser LV abgeschlossen werden:
- Algorithmen und Datenstrukturen
- Datenbanksysteme
- Software Engineering
- Netzwerktechnologien

30% Übungsblätter
30% Programmierübungen im Team
40% schriftlicher Abschlusstest

>87,00%: 1
75,00% - 86,99: 2
63,00% - 74,99%: 3
50,00% - 62,99%: 4
< 50%: 5

Prüfungsstoff

Scientific Data and Feature Spaces
Clustering
Big Data Frameworks
Searching Numerical Data
Searching Sets
Searching & Mining Graphs
Analyzing Large Networks

Literatur

Ester M., Sander J. Knowledge Discovery in Databases: Techniken und Anwendungen.
J. Leskovec, A. Rajaraman, J. Ullman. Mining of Massive Datasets.
J. Han, M. Kamber, J.Pei.Data Mining: Concepts and Techniques.
I. H. Witten , E. Frank, M. A. Hall. Data Mining: Practical Machine Learning Tools and Techniques.

Zuordnung im Vorlesungsverzeichnis

Module: SDM

Letzte Änderung: Fr 12.05.2023 00:13