class: title-slide <script async defer data-domain="rstatszh.github.io/website" src="https://plausible.io/js/plausible.js"></script> # rstatsZH - Data Science mit R ## Vektoren in R und mehr Git .bottom[
Lars Schöbitz
2023-10-05
] --- # Rückblick - Woche 4 ## `dplyr` Funktionen .pull-left[ - `select()` Hilfe Funktionen - `starts_with()` - `ends_with()` - `contains()` ] .pull-right[ - `relocate()` - `rename()` - `mutate()` - `group_by()` - `summarise()` - `count()` ] --- --- # Hausaufgabe 4 - Übung 3 .panelset[ .panel[.panel-name[Plot] <img src="e1_d05-vektoren_files/figure-html/unnamed-chunk-4-1.png" width="90%" style="display: block; margin: auto;" /> ] .panel[.panel-name[Code] ```r ggplot(lernende2019, aes(x = Stufe, y = Anzahl, fill = Staatsangehoerigkeit)) + geom_col() + * coord_flip() + * scale_y_continuous(breaks = seq(0, 100000, 10000)) + scale_fill_viridis_d() + labs(title = "Anzahl Schüler_innen", subtitle = "Kanton Zürich, 2019", fill = "Nationalität", caption = "Daten: https://opendata.swiss/de/dataset/ubersicht-uber-alle-lernenden-im-kanton-zurich") + * theme_minimal() + theme(legend.position = "bottom", * panel.grid.major.y = element_blank()) ``` ] ] --- # Hausaufgabe 4 - Übung 5 Was gibt die Spalte `n` an? .pull-left[ ```r # Häufigkeitstabelle 1 - Zusammenfassen mit count() lernende2019 %>% count(Schultyp) ``` ``` # A tibble: 6 × 2 Schultyp n <chr> <int> 1 Berufsfachschule 12 2 Brückenangebot 12 3 Heim- und Sonderschule 38 4 Höhere Berufsbildung 12 5 Mittelschule 16 6 Volksschule 28 ``` ] .pull-right[ ```r # Häufigkeitstabelle 2 - Zusammfassen mit group_by %>% summarise() lernende2019 %>% group_by(Schultyp) %>% summarise( n = n() ) ``` ``` # A tibble: 6 × 2 Schultyp n <chr> <int> 1 Berufsfachschule 12 2 Brückenangebot 12 3 Heim- und Sonderschule 38 4 Höhere Berufsbildung 12 5 Mittelschule 16 6 Volksschule 28 ``` ] --- # Hausaufgabe 4 - Übung 5 Wie kommen wir auf die Anzahl Schüler_innen. .pull-left[ ```r # Häufigkeitstabelle 1 - Zusammenfassen mit count() lernende2019 %>% count(Schultyp, wt = Anzahl) ``` ``` # A tibble: 6 × 2 Schultyp n <chr> <dbl> 1 Berufsfachschule 45532 2 Brückenangebot 2078 3 Heim- und Sonderschule 3021 4 Höhere Berufsbildung 19780 5 Mittelschule 20591 6 Volksschule 161072 ``` ] .pull-right[ ```r # Häufigkeitstabelle 2 - Zusammfassen mit group_by %>% summarise() lernende2019 %>% group_by(Schultyp) %>% summarise( n = sum(Anzahl) ) ``` ``` # A tibble: 6 × 2 Schultyp n <chr> <dbl> 1 Berufsfachschule 45532 2 Brückenangebot 2078 3 Heim- und Sonderschule 3021 4 Höhere Berufsbildung 19780 5 Mittelschule 20591 6 Volksschule 161072 ``` ] --- # Hausaufgabe 4 - Übung 6 .pull-left[ ```r lernende %>% drop_na %>% group_by(Jahr) %>% summarise( Total = sum(Anzahl) ) %>% mutate( Differenz = Total - lag(Total) ) %>% mutate( Veraenderung = case_when( Differenz > 0 ~ "Zunahme", Differenz < 0 ~ "Abnahme" ) ) ``` ] .pull-right[ ``` # A tibble: 23 × 4 Jahr Total Differenz Veraenderung <dbl> <dbl> <dbl> <chr> 1 2000 217135 NA <NA> 2 2001 220048 2913 Zunahme 3 2002 226706 6658 Zunahme 4 2003 229676 2970 Zunahme 5 2004 228468 -1208 Abnahme 6 2005 230183 1715 Zunahme # ℹ 17 more rows ``` ] --- background-image: url(https://jrnold.github.io/r4ds-exercise-solutions/img/r4ds-exercise-solutions-cover.png) background-size: contain background-position: right # R for Data Science - Lösungsbuch .pull-left[ Lösungen zu den Übungen aus dem Buch mit nützlichen Erklärungen gibt es hier: https://jrnold.github.io/r4ds-exercise-solutions/ ] --- # Ziele für diese Woche Am Ende dieser Woche könnt ihr: - Einer Anleitung folgen um kollaborativ mit Git und GitHub an einem Projekt zu arbeiten - Die Begriffe `git add`, `git commit`, `git push`, und `git pull` unterscheiden - Die vier grundlegenden Vektortypen in R wiedergeben - Den Unterschied zwischen einem Vektor vom Typ "character" und "factor" erläutern --- .note[ # Praktikum 08-01 - Ehedaten ## Live Code 1. **GitHub**: Öffne die GitHub Organisation für den Kurs: https://github.com/rstatszh-k008 2. **GitHub**: Nutze die Suche um das Praktikum 08-01 (prak-08-01) mit deinem Benutzernamen zu finden 3. **GitHub**: Klicke auf den grünen Button (Code) und kopiere die URL in die Zwischenablage 3. **Posit Cloud**: Öffne deinen Arbeitsbereich für den Kurs in der Posit Cloud 4. **Posit Cloud / Projects**: Klicke auf "New Project from GitHub Repository" 5. **RStudio IDE**: Finde den Datei Manager und den Git Reiter 6. **Zoom Chat**: Schreibt wenn ihr soweit seid ] --- class: left background-image: url(img/coffee-break.jpg) background-position: right background-size: contain # Pause
−
+
10
:
00
.footnote[Photo by: [Blake Wisz](https://unsplash.com/@blakewisz)] --- # Praktikum 08-02 - Git / GitHub Ihr könnt bereits: - `git add` (Das Häkchen bei Staged setzen) - `git commit` - `git push` Neu lernt ihr: - `git pull` --- # Praktikum 08-02 - Zwei Rollen .pull-left[ **Person 1 - Push** - Öffnet die R Markdown Datei für die Übung - Teilt den Bildschirm - Schreibt den Code - Führt die Git Befehle "add", "commit" und "push" aus ] -- .pull-right[ **Person 2 - Pull** - Öffnet die R Markdown Datei für die Übung - Schreibt selbst **keinen** Code - Unterstützt Person 1 bei den Übungen - Führt den Git Befehl "pull" aus ] --- .note[ # Praktikum 08-02 - Git / GitHub - Ehedaten ## 2er Teams **Lest die Anleitungen aufmerksam und entscheidet welche Person zu Beginn den Bildschirm teilt** 1. **E-Mail**: Öffne deine Email und klicke auf den Link zu deinem GitHub **Team** repo für **prak-08-02-team0X** 2. **GitHub**: Klicke auf den grünen Button "Code" und kopiere den Link für das Repo in deine Zwischenablage 3. **Posit Cloud**: Öffne deinen Arbeitsbereich für den Kurs in der Posit Cloud 4. **Posit Cloud / Projects**: Klicke auf "New Project from GitHub Repository" ] --- class: left background-image: url(img/coffee-break.jpg) background-position: right background-size: contain # Pause
−
+
10
:
00
.footnote[Photo by: [Blake Wisz](https://unsplash.com/@blakewisz)] --- .note[ # Demonstration 2 - Vektoren 1. Schaut mir beim Programmieren zu 2. Schreibt selbst **keinen Code** 3. Macht euch Notizen und stellt Fragen ] --- class: middle, inverse # .big[Hausaufgabe] --- .note[ # Hausaufgabe 5 - Erstes Projekt mit Git und GitHub - Keine Vorlage von meiner Seite - Alle Schritte sind auf der Webseite beschrieben: https://rstatszh.github.io/website/ha-05-erstes-projekt.html ] --- class: middle, inverse # .big[Feedback] --- class: left background-image: url(img/tor.jpg) background-position: right background-size: contain # Ziele erreicht? Bitte ausfüllen: [https://forms.gle/fEmF9899WEnCETdL8](https://forms.gle/fEmF9899WEnCETdL8) .pull-left[ .footnote[Photo by: [Virgil Cayasa](https://unsplash.com/@virgilcayasa)] ] --- # 🌻 Danke Für die Aufmerksamkeit! Für die R packages [{xaringan}](https://github.com/yihui/xaringan) und [{xaringanthemer}](https://github.com/gadenbuie/xaringanthemer) mit welchen die Folien geschrieben wurden. Eine PDF Version der Folien kann hier heruntergeladen werden: https://github.com/rstatsZH/website/raw/master/slides/e1_d05-vektoren/e1_d05-vektoren.pdf
Für [Data Science in a Box](https://datasciencebox.org/) und [Remaster the Tidyverse](https://github.com/rstudio-education/remaster-the-tidyverse), von welchen ich Materialien für diesen Kurs nutze und welche genau wie diese Folien mit [Creative Commons Attribution Share Alike 4.0 International](https://creativecommons.org/licenses/by-sa/4.0/) lizensiert sind.