Pre-Processing

Die Datenkunde 2.0 gibt den Studierenden das Wissen und die Fertigkeiten an die Hand, selbst erhobene und bezogene Daten für Ihre eigenen Analysen vorzubereiten und anzureichern (preprocessing). Die Einheit vermittelt zentrale Datenverarbeitungskompetenzen und thematisiert bekannte Problemzonen der umweltwissenschaftlichen Datenverarbeitung – immer mit einer „hands-on” Perspektive auf die begleitenden R-Übungen. Die Studierenden lernen die Eigenschaften ihrer Datensätze in der Fachsprache korrekt zu beschreiben. Sie lernen ausserdem Metadaten zu verstehen und die Implikationen derselben für ihre eigenen Analyseprojekte kritisch zu beurteilen. Zentrale Konzepte der lesson sind Skalenniveaus, Datentypen, Zeitdaten und Typumwandlungen.

Die Lesson vermittelt zentralste Fertigkeiten zur Vorverarbeitung von strukturierten Daten in der umweltwissenschaftlichen Forschung: Datensätze verbinden (Joins) und umformen („reshape”, „split-apply-combine”). Im Anwendungskontext haben Daten selten von Anfang an diejenige Struktur, welche für die statistische Auswertung oder für die Informationsvisualisierung erforderlich wäre. In dieser lesson lernen die Studierenden die für diese oft zeitraubenden Preprocessing-Schritte notwendigen Konzepte und R-Werkzeuge kennen und kompetent anzuwenden.

Titel Datum Lesson Thema
Vorbereitung 2023-10-10 PrePro1 Vorbereitung
Prepro 1: Demo 2023-10-10 PrePro1 Datentypen
PrePro 1: Übung 2023-10-10 PrePro1 Datentypen
Prepro 2: Demo 2023-10-16 PrePro2 Piping / Joins
Prepro 2: Übung A 2023-10-16 PrePro2 Piping / Joins
Prepro 2: Übung B 2023-10-16 PrePro2 Piping / Joins
Prepro 3: Demo 2023-10-17 PrePro3 Split-Apply-Combine
Prepro 3: Übung 2023-10-17 PrePro3 Split-Apply-Combine
Keine Treffer