Universität Wien
Achtung! Das Lehrangebot ist noch nicht vollständig und wird bis Semesterbeginn laufend ergänzt.

270148 PR Data science in metabolomics and proteomics (2021W)

3.00 ECTS (3.00 SWS), SPL 27 - Chemie
Prüfungsimmanente Lehrveranstaltung

An/Abmeldung

Hinweis: Ihr Anmeldezeitpunkt innerhalb der Frist hat keine Auswirkungen auf die Platzvergabe (kein "first come, first served").

Details

max. 20 Teilnehmer*innen
Sprache: Deutsch

Lehrende

Termine

22.-26.11.2021


Information

Ziele, Inhalte und Methode der Lehrveranstaltung

Diese Lehrveranstaltung wird auf Englisch abgehalten.

Hintergrund: Moderne LC-HRMS basierte Metabolomics- oder Proteomics-Studien generieren umfangreiche, mehrere GB große Datensätze. In hypothesengenerierenden Forschungsprojekten ist es unmöglich diese Rohdaten händisch oder manuell zu analysieren um sie zu verstehen und neue biologische Hypothesen daraus abzuleiten. Hierfür benötigt es automatisierte, maßgeschneiderte Softwaretools und Programme, sowie ein Verständnis für deren Arbeitsweise und Routinen.
In dieser LV erlangen die Studierenden einen Einblick in diese automatisch Datenauswertung von LC-HRMS Datensätzen.

Ziele: Anhand eines Metabolomicsdatensatzes erlernen die Studierenden, wie die Auswertung (Peakpicking, Gruppieren, optionales Retentionszeitalignment, Integration der Peakflächen) mittels XCMS in der Statistikumgebung und Programmiersprache R zu implementieren ist. Sie verstehen und optimieren die unterschiedlichen Parameter der dafür notwendigen Funktionen und können die Ergebnisse visualisieren und kritisch beurteilen. Anschließend exportieren die Studierenden die detektierten Substanzen. Ein kurzer Überblick über gängige uni- und multivariate statistische Methoden soll den Studierenden weitere statistische Auswertemöglichkeiten demonstrieren.

Inhalte: In dieser Lehrveranstaltung werden folgende Themen(gebiete) vorgestellt bzw. gemeinsam erarbeitet.
• Einführung in die Programmiersprache R
• Einlesen der LC-HRMS Datensätze in R
• Prozessieren der Datensätze mit XCMS und CAMERA
• Verständnis für unterschiedliche Einstellungen der XCMS Parameter
• Semiautomatische Optimierung der XCMS Parameter, um die Datenauswertung bestmöglich durchzuführen
• Export der detektierten Substanzen in Form einer Datenmatrix
• Kurzer Überblick über gängige statistische Methoden zur weiteren Auswertung der Datensätze
Die Lehrveranstaltung gliedert sich in einen Vorlesungsteil, in dem die erforderlichen Kenntnisse vermittelt werden, und in einen Übungsteil, der dazu dient, diese Kenntnisse praktisch zu vertiefen.

Methoden: Die Inhalte der Lehrveranstaltungen werden durch Vorträge, praktische Übungen, Präsentationen, Diskussionen, mündliche Präsentationen, Gruppenarbeiten, etc. erarbeitet.

Anmerkungen: Die Studierenden werden eine zentrale R-Installation (R-Studio Server) verwenden. Es ist ein Laptop in die LV mitzubringen, der mit dem Uninetzwerk verbunden werden kann.

Vorkenntnisse:
• Sicherer Umgang mit PCs
• Sicherer Umgang mit MS Office Excel im Speziellen mit Formeln
• Verständnis für LC-HRMS Datensätze

Art der Leistungskontrolle und erlaubte Hilfsmittel

Art der Leistungskontrolle:
• Mitarbeit
• Schriftlicher Abschlusstest über die (vorgetragenen) Inhalte
• Präsentation der erarbeiteten Auswertung der Demodatensätze

Zur Sicherung der guten wissenschaftlichen Praxis kann die Lehrveranstaltungsleitung Studierende zu einem notenrelevanten Gespräch einladen, welches positiv zu absolvieren ist.

Erlaubte Hilfsmittel: R-Dokumentation (offline)

Mindestanforderungen und Beurteilungsmaßstab

Die Anwesenheit bei der ersten Einheit des Seminars ist verpflichtend. Die Anwesenheit muss zu 75% erfüllt sein.

Für das Erreichen einer positiven Note müssen 50% der maximal möglichen Punktezahl erreicht werden. Jede Teilleistung muss zum Abschluss der Lehrveranstaltung erbracht werden.

Beurteilungsmaßstab:
Es können 100 Punkte für diese LV erreicht werden. Diese sind aufgeteilt in:
• Mitarbeit: 30 Punkte
• Abschlusstest: 40 Punkte
• mündliche Präsentation: 30 Punkte

Die Notenvergabe verläuft nach folgendem Punkteschema:
• 1 (sehr gut): 100 - 89 Punkte
• 2 (gut): 88 - 76 Punkte
• 3 (befriedigend): 75 - 63 Punkte
• 4 (genügend): 62 - 50 Punkte
• 5 (nicht genügend): 49 - 0 Punkte
(Es wird zugunsten der Studenten gerundet.)

Prüfungsstoff

Der Inhalt der Einheiten und Übungen.

Literatur

Für die Programmiersprache R ist im Internet eine Vielzahl an frei zugänglichem Material verfügbar. Es wird empfohlen, diese Tutorials vorab zu lesen um einen (sicheren) Umgang mit R zu erlangen. Eine Auswahl ist:
https://www.statmethods.net/r-tutorial/index.html
https://cran.r-project.org/doc/contrib/Paradis-rdebuts_en.pdf

Für XCMS und CAMERA sind folgende Publikationen und Literatur ein guter Einstieg. Diese sind hier abrufbar:
https://dx.doi.org/10.1186/1471-2105-9-504
https://dx.doi.org/10.1021/ac202450g
https://www.bioconductor.org/packages/release/bioc/vignettes/CAMERA/inst/doc/CAMERA.pdf

Zuordnung im Vorlesungsverzeichnis

AN-2, BC-1, CHE II-1

Letzte Änderung: Mi 20.10.2021 15:09