Universität Wien
Achtung! Das Lehrangebot ist noch nicht vollständig und wird bis Semesterbeginn laufend ergänzt.

052813 VU Scientific Data Management (2024S)

Prüfungsimmanente Lehrveranstaltung

An/Abmeldung

Hinweis: Ihr Anmeldezeitpunkt innerhalb der Frist hat keine Auswirkungen auf die Platzvergabe (kein "first come, first served").

Details

max. 25 Teilnehmer*innen
Sprache: Englisch

Lehrende

Termine (iCal) - nächster Termin ist mit N markiert

  • Freitag 01.03. 15:00 - 16:30 Hörsaal 2, Währinger Straße 29 2.OG
  • Dienstag 05.03. 15:00 - 16:30 Hörsaal 2, Währinger Straße 29 2.OG
  • Freitag 08.03. 15:00 - 16:30 Hörsaal 2, Währinger Straße 29 2.OG
  • Freitag 15.03. 15:00 - 16:30 Hörsaal 2, Währinger Straße 29 2.OG
  • Dienstag 19.03. 15:00 - 16:30 Hörsaal 2, Währinger Straße 29 2.OG
  • Freitag 22.03. 15:00 - 16:30 Hörsaal 2, Währinger Straße 29 2.OG
    Seminarraum 12, Währinger Straße 29 2.OG
  • Dienstag 09.04. 15:00 - 16:30 Hörsaal 2, Währinger Straße 29 2.OG
  • Freitag 12.04. 15:00 - 16:30 Hörsaal 2, Währinger Straße 29 2.OG
  • Dienstag 16.04. 15:00 - 16:30 Hörsaal 2, Währinger Straße 29 2.OG
  • Freitag 19.04. 15:00 - 16:30 Hörsaal 2, Währinger Straße 29 2.OG
  • Dienstag 23.04. 15:00 - 16:30 Hörsaal 2, Währinger Straße 29 2.OG
    Seminarraum 11, Währinger Straße 29 2.OG
  • Freitag 26.04. 15:00 - 16:30 Hörsaal 2, Währinger Straße 29 2.OG
  • Dienstag 30.04. 15:00 - 16:30 Hörsaal 2, Währinger Straße 29 2.OG
  • Freitag 03.05. 15:00 - 16:30 Hörsaal 2, Währinger Straße 29 2.OG
    Seminarraum 7, Währinger Straße 29 1.OG
  • Dienstag 07.05. 15:00 - 16:30 Hörsaal 2, Währinger Straße 29 2.OG
  • Freitag 10.05. 15:00 - 16:30 Hörsaal 2, Währinger Straße 29 2.OG
  • Dienstag 14.05. 15:00 - 16:30 Hörsaal 2, Währinger Straße 29 2.OG
  • Freitag 17.05. 15:00 - 16:30 Hörsaal 2, Währinger Straße 29 2.OG
  • Dienstag 21.05. 15:00 - 16:30 Hörsaal 2, Währinger Straße 29 2.OG
  • Freitag 24.05. 15:00 - 16:30 Hörsaal 2, Währinger Straße 29 2.OG
    Seminarraum 12, Währinger Straße 29 2.OG
  • Dienstag 28.05. 15:00 - 16:30 Hörsaal 2, Währinger Straße 29 2.OG
  • Freitag 31.05. 15:00 - 16:30 Hörsaal 2, Währinger Straße 29 2.OG
  • Dienstag 04.06. 15:00 - 16:30 Hörsaal 2, Währinger Straße 29 2.OG
    Seminarraum 12, Währinger Straße 29 2.OG
  • Freitag 07.06. 15:00 - 16:30 Hörsaal 2, Währinger Straße 29 2.OG
  • Dienstag 11.06. 15:00 - 16:30 Hörsaal 2, Währinger Straße 29 2.OG
  • Freitag 14.06. 15:00 - 16:30 Hörsaal 2, Währinger Straße 29 2.OG
  • Dienstag 18.06. 15:00 - 16:30 Hörsaal 2, Währinger Straße 29 2.OG
    Seminarraum 8, Währinger Straße 29 1.OG
  • Freitag 21.06. 15:00 - 16:30 Hörsaal 2, Währinger Straße 29 2.OG
  • Dienstag 25.06. 15:00 - 16:30 Hörsaal 2, Währinger Straße 29 2.OG
  • Freitag 28.06. 15:00 - 16:30 Hörsaal 2, Währinger Straße 29 2.OG
    Hörsaal 3, Währinger Straße 29 3.OG

Information

Ziele, Inhalte und Methode der Lehrveranstaltung

This course will be taught in English and take place on-site. The lectures will be streamed, recorded, and made available on Moodle. Exercise sessions will be on-site only and attending them is mandatory. The midterm and final exams will be on-site.

The course introduces central methods for organizing and analyzing large and scientific data, such as distributed data repositories, index data structures, hashing, classification, and clustering techniques. In particular, methods for structured data such as sets, images, text documents, and graphs are discussed.

Exercises and programming assignments complement the lectures. Students will learn ways to realize similarity search and data mining on large data, e.g., using parallelization with MapReduce, Apache Spark, or filter-refinement techniques.

Subject-specific goals:
- Analysis of scientific data
- Interpretation and evaluation of results of the analysis process
- Choosing and applying techniques for structured data
- Implementation of scalable solutions for large amounts of data
- Support and advice of users

Generic goals:
- Teamwork
- Improvement of programming skills
- Understanding of interplay in data mining and scientific computing

It is recommended to complete the following courses before attending:
- Algorithmen und Datenstrukturen
- Datenbanksysteme
- Software Engineering
- Netzwerktechnologien

Art der Leistungskontrolle und erlaubte Hilfsmittel

Active participation
Exercises (individual work)
Programming assignments (group work)
Written midterm exam (individual work)
Written final exam (individual work)

Mindestanforderungen und Beurteilungsmaßstab

The overall grade is composed as follows:
30% Exercises
30% Programming assignments
20% Written midterm exam
20% Written final exam

To successfully complete the course, you must achieve at least 40% of the points in the midterm exam and at least 40% of the points in the final exam.

Attendance of the lecture parts of the course is voluntary but highly recommended. Attendance of the exercise discussions, programming assignment discussions and the written exams is compulsory to obtain points.

Grades will be given according to the following scheme:
100.00 - 87.00: 1
75.00 - 86.99: 2
63.00 - 74.99: 3
50.00 - 62.99: 4
00.00 - 49.99: 5

Prüfungsstoff

All topics covered in class, the exercises, and the programming assignments.

- Scientific Data and Feature Spaces
- Clustering
- Big Data Frameworks
- Searching Numerical Data
- Searching Sets
- Searching & Mining Graphs
- Analyzing Large Networks

Literatur

J. Leskovec, A. Rajaraman, J. Ullman. Mining of Massive Datasets.
J. Han, M. Kamber, J.Pei.Data Mining: Concepts and Techniques.
I. H. Witten , E. Frank, M. A. Hall. Data Mining: Practical Machine Learning Tools and Techniques.

Further literature and references to research papers will be provided via Moodle.

Zuordnung im Vorlesungsverzeichnis

Module: SDM

Letzte Änderung: Mi 15.05.2024 10:05