Übungen zum Erlernen der Grundlagen des Umganges mit Daten in Python. Die Übungen gliedern sich in einen Python Crash Kurs (Übung 00 bis Übung 04) und darauf aufbauende Fallstudien (Übungen 05 bis 08). Um den Kurs durchzuarbeiten empfehlen wir, Übungen 00-04 zu bearbeiten und dann eine der drei Fallstudien auszuwählen und zu bearbeiten.
Tutorials for learning basic handling and analysis of data using Python. Tutorials are split into a Python crash course (tutorials 00 to 04) and case studies that build on the crash course (tutorials 05 to 08). To work through the course we recommend to complete tutorials 00 to 04 and then pick one of the available three case studies.
Der Python Crash Kurs dient dazu, die generellen Grundlagen des Programmierens mit Python sowie den Einsatz von Bibliotheken zum Umgang mit verschiedenen Datentypen zu erlernen. Dieser Teil des Kurses ist sehr kurz gehalten und geht nur auf Inhalte ein, die im späteren Verlauf des Kurses zum Bearbeiten der Fallstudien benötigt werden.
Die verschiedenen Übungen gliedern sich in
- Übung 00: Einführung in den Umgang mit Jupyter-Notebooks
- Übung 01: Nutzung von Python als Taschenrechner
- Übung 02: Listen, Schleifen und Tabellen
- Übung 03: Logik, Verzweigungen und Filter
- Übung 04: Funktionen, Bilder und Text
Die für das Bearbeiten der Übungen notwendingen Daten finden sich im Ordner data.
The Python crash course is aimed at teaching programming basics in Python as well as the usage of libraries and handling of different data types. This part of the course is very brief and only introduces concepts that will be strictly necessary in later parts of the course.
The content of the tutorials is as follows:
- Übung 00: Introduction to working with Jupyter Notebooks
- Übung 01: Using Python as calculator
- Übung 02: Lists, loops and tables
- Übung 03: Logic, conditionals and filters
- Übung 04: Functions, images and text
The data sets needed to complete the tutorials can be found in the folder data.
Aktuell gibt es drei Fallstudien zu den Themen:
- Allgemein (Analyse von Twitter Daten von Donald Trump und Russischen Trollen)
- Archäologie (Analyse von Funden von Tonscherben aus dem Mittelmeerraum)
- Wirtschaft (Analyse von historischen Daten zu Produktivität und Arbeitsniederlegungen).
Jede der Fallstudien behandelt folgende Themenbereiche in teilweise etwas abweichender Reihenfolge
- Laden und Speichern von Daten
- Säubern von Daten
- Visualisierung als Histogramm, Scatterplot und Zeitreihe
- Deskriptive Statistik (Mittelwert, Varianz)
- Inferenz (lineare Regression)
Darüber hinaus wird je nach Fallstudie auf themenspezifische Anwendungen wie z.B. der Umgang mit Text (allgemeine Fallstudie) oder die Visualisierung von Daten auf Landkarten (Archäologie) eingegangen. Die für die Bearbeitung der Fallstudien benötigten Daten werden im Verlauf der Übungsaufgaben aus freien Quellen heruntergeladen und lokal gespeichert. Dafür muss ein Ordner '''data''' im Dateiverzeichnis der jeweiligen Fallstudie angelegt werden.
There are currently three case studies available, evolving around the following topics
- General (Analysis of Tweets of Donald Trump and Russian trolls)
- Archaeology (Analysis of a database of antique pottery shard from the mediterranean)
- Wirtschaft (Analysis of GDP-data and labour disputes).
Every case study contains the following topics, sometimes in a different order
- Reading and writing data
- Cleaning data
- Visualization using histograms, scatterplots and time series
- Descriptve statistics (mean, variance)
- Inference (linear regression)
Additionally, every case study contains discipline specific topics, for example the handling of text data (general case study) or the visualization of data on a map (archaeology case study). The data needed to complete the case studies will be downloaded from publicly available sources during the course of the case study and saved locally. For this to work, the user is required to create a folder named "data" in the folder containing the respective case study.
- Jana Lasser, Zentrum für Statistik und Max Planck Institut für Dynamik und Selbstorganisation ([email protected])
- Debsankha Manik Max Planck Institut für Dynamik und Selbstorganisation ([email protected])
- Maximilian Vossel
- Florian Habenstein
- Moritz Becker
Dieses Repository beinhaltet die Übungsaufgaben und Lösungen die begleitend zur Vorlesung "Daten Lesen Lernen" im SoSe 2019 an der Universität Göttingen durchgeführt wurden.
Die Lehrmaterialien entstehen im Zuge einer Förderung des Stifterverbandes zur Förderung der Data Literacy Education an Deutschen Hochschulen.
This repository contains exercises and solutions used in the lecture "Daten Lesen Lernen", which was first taught during the summer term 2019 at the University of Göttingen.
The lecture materials are created thanks to a grant by the Stifterverband for the advancement of Data Literacy Education at German universities.