Stat1: Lösung

Veröffentlichungsdatum

30. Oktober 2023

Musterlösung Übung 1.1: Assoziationstest

In diesem Beispiel soll einem Klischee auf den Grund gegagen werden: Sind Aargauer überdurchschnittlich mit weissen Socken assoziiert? Die Datenerhebung basiert auf männlichen Studenten bei denen folgende beiden binären Variablen erhoben wurden:

  • Sockenfarbe: weiss, nicht-weiss
  • Selbstdeklarierte Kantonsangehörigkeit: AG, nicht-AG

Die Hypothese ist: Das Klischee trifft zu, weisse Socken sind überdurchschnittlich häufig mit Aargauer Studenten assoziiert.

Die Datenerhebung unter 35 Studenten ergab folgende Datengrundlage:

  • Weisssockige Aargauer: 4
  • Nicht-weisssockige Aargauer: 2
  • Weissockige nicht-Aargauer: 7
  • Nicht-weisssockige nicht-Aargauer: 22
# Matrix erstellen
Aargauer <- c(4, 2)
names(Aargauer) <- c("Weiss", "NotWeiss")
NotAargauer <- c(7, 22)
names(NotAargauer) <- c("Weiss", "NotWeiss")
AGsocks <- data.frame(Aargauer, NotAargauer)
AGsocks <- as.matrix(AGsocks)
AGsocks
         Aargauer NotAargauer
Weiss           4           7
NotWeiss        2          22
# Daten anschauen mit erstem Google-Ergebnis für "Assoziation Plot r"
assocplot(AGsocks) # Interpretation des Plots mit dem Befehl ?assocplot

Der Assoziationsplot zeigt, dass in den Daten weisse Socken bei den Aargauern überverterten und bei den Nicht-Aargauern untervertreten sind.

Für kleine Erwartungswerte in den Zellen (< 5) ist der Chi-Quadrat-Test nicht zuverlässig (siehe “Warning message”). Darum wird mit Fishers exaktem Test gearbeitet.

# Tests durchführen
chisq.test(AGsocks) # Chi-Quadrat-Test nur zum anschauen.

    Pearson's Chi-squared test with Yates' continuity correction

data:  AGsocks
X-squared = 2.4323, df = 1, p-value = 0.1189
fisher.test(AGsocks) # "Fisher's Exact Test for Count Data"

    Fisher's Exact Test for Count Data

data:  AGsocks
p-value = 0.06323
alternative hypothesis: true odds ratio is not equal to 1
95 percent confidence interval:
  0.6811227 78.4336189
sample estimates:
odds ratio 
  5.897263 

Ergebnisse

In den erhobenen Daten konnte keine signifikante Assoziation zwischen Kantonangehörigkeit (AG, nicht-AG) und Sockenfarbe (weiss, nicht-weiss) festgestellt werden. Der p-Wert von Fishers exaktem Test war nur marginal signifikant (p = 0.063). Das nicht-signfikante Resultat überrascht auf den ersten Blick, denn der “odds ratio” im Datensatz ist mit 5.9 relativ hoch und 67 % der Aargauer trugen weisse Socken während nur 24 % der Nicht-Aargauer weisse Socken trugen. Doch war der Anteil von nur 6 Aargauer in der nur 35 Männer umfassenden Stichprobe relativ klein, um ein verlässliches Bild der Sockenpräferenzen der Aargauer zu machen. Insofern leuchtet es ein, das bei dieser kleinen und unausgewogenen Stichprobe die “Power” des satistischen Tests (um die Nullhypothese zu verwerfen) relativ klein ist.

Musterlösung Übung 1.2: t-Test

Leseempfehlung Kapitel 2 von Manny Gimond

Null- und Alternativhypothese

\(H_0\): Es gibt keinen Unterschied in den Verkaufszahlen zwischen den Basis- und den Interventionswochen.

\(H_1\): Es gibt einen Unterschied in den Verkaufszahlen zwischen den Basis- und den Interventionswochen.

# lade Daten
df <- readr::read_delim("datasets/stat1-4/Datensatz_novanimal_Uebung_Statistik1.2.csv", delim = ";")

# überprüft die Voraussetzungen für einen t-Test
ggplot(df, aes(x = condit, y = tot_sold)) + # achtung 0 Punkt fehlt
  geom_boxplot(fill = "white", color = "black", size = 1) +
  labs(x = "\nBedingungen", y = "Durchschnittlich verkaufte Gerichte pro Woche\n") +
  mytheme

# Auf den ersten Blick scheint es keine starken Abweichungen zu einer
# Normalverteilung zu geben resp. es sind keine extremen schiefen Verteilungen
# ersichtlich (vgl. Skript Statistik 2)
# führt einen t-Tests durch;
# es wird angenommen, dass die Verkaufszahlen zwischen den Bedingungen
# unabhängig sind

t_test <- t.test(tot_sold ~ condit, data = df, var.equl = T)
t_test

    Welch Two Sample t-test

data:  tot_sold by condit
t = 0.27168, df = 9.9707, p-value = 0.7914
alternative hypothesis: true difference in means between group Basis and group Intervention is not equal to 0
95 percent confidence interval:
 -115.2743  147.2743
sample estimates:
       mean in group Basis mean in group Intervention 
                      2203                       2187 
# alternative Formulierung
t.test(
  df[df$condit == "Basis", ]$tot_sold,
  df[df$condit == "Intervention", ]$tot_sold
)

    Welch Two Sample t-test

data:  df[df$condit == "Basis", ]$tot_sold and df[df$condit == "Intervention", ]$tot_sold
t = 0.27168, df = 9.9707, p-value = 0.7914
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
 -115.2743  147.2743
sample estimates:
mean of x mean of y 
     2203      2187 

Methoden

Unser Ziel bestand darin, einen Vergleich der aggregierten Verkaufszahlen zwischen den Interventions- und Basiswochen durchzuführen. Wir gingen davon aus, dass die wöchentlichen Verkaufszahlen unabhängig voneinander sind, weshalb wir die Unterschiede zwischen den Verkaufszahlen pro Woche in den beiden Bedingungen mittels eines t-Tests untersuchten. Obwohl bei der visuellen Prüfung der Modellvoraussetzungen keine schwerwiegenden Verletzungen festgestellt wurden (abgesehen von einem Ausreißer), entschieden wir uns dennoch für einen Welch t-Test. Es sei angemerkt, dass die Gruppengröße mit jeweils n = 6 Wochen eher klein war. Trotzdem erzielten die T-Tests verlässliche Ergebnisse. Für weitere Informationen zu diesem Thema verweisen wir auf die verlinkte Studie.

Ergebnisse

In den Basiswochen werden wöchentlich mehr Gerichte verkauft als in den Interventionswochen, wie in Abbildung 1 ersichtlich ist. Allerdings ergab der Welch t-Test, dass es keine signifikanten Unterschiede in den wöchentlichen Verkaufszahlen zwischen den beiden Bedingungen (t(10) = 0.272 , p = 0.791). m die Ergebnisse weiter zu bestätigen, könnte eine \(\chi^2\)-Test durchgeführt werden, da die Gruppengröße mit n = 6 als eher klein betrachtet werden kann.

Abbildung 19.1: Die wöchentlichen Verkaufszahlen für die Interventions- und Basiswochen unterscheiden sich nicht signifikant.