Wenn Sie Fragen stellen möchten,
einfach per Mail, direkt oder per WhatsApp
0178 87 55 145 oder
0157 740 58 477.
Ich beantworte Fragen gerne und gebe gern den einen oder anderen Tipp. Wenn Sie etwas von mir rechnen lassen möchten, bräuchte ich Einblick in Ihre Daten (Excel, SPSS-Daten) und eine Liste Ihrer Fragen (eine Word-Seite).

Ein Säulendiagramm für Messwiederholungen erstellen


Ein Säulendiagramm erstellen, wenn man Messwiederholungen hat


Ein Säulendiagramm zeigt für wiederholt gemessene Werte (z.B. 3 Zeitpunkte, oder mehrere Meßwerte mit vergleichbarer Skala) zeigt recht intuitiv an, wie ein Verlauf in Form von Mittelwerten aussieht. Hier ein Beispiel für R und RStudio.



Idee der Befehlszeilen für das Säulendiagramm


Mit diesen Zeilen habe ich es erstellt. Die R-Syntax ist dieses mal leider etwas komplizierter (sorry).

Man hat 3 Messungen, die in 3 Datenspalten stehen und möchte diese als 3-Balken-Grafik sehen. Problem ist, ggplot möchte aber nur eine Spalte haben, in denen die 3 Variablen untereinander stehen.

Wir brauchen die library "ggplot2". Die Daten ("data") haben 4 Spalten und den Spaltennamen "var1" bis "var3" (für drei Messungen) und eine "Id"-Spalte.
Zwischendurch müssen die Daten umgestellt werden (die Var1 bis var3 möchte ggplot, wie gesagt, in nur einer Spalte haben). Das ganze geht mit "data.table" und "melt".
Danach rechnet man Mittelwert und die SD ("dplyr" und "summarize") und kann diese dann mit dem ggplot in die Grafik packen. Ergänzend werden die Labels unter der x-Achse entfernt ("xlab"), dann die y-Achse auf 0 bis 13 eingestellt und einer-Abschnitte dargestellt. Das "expand" setzt den grauen Bereich auf die Null-Linie (das ist aber Geschmackssache).

Die Befehlszeilen für das Säulendiagramm


data = data.frame(id = seq(1:5), var1 = c(rnorm(5, mean = 5, sd = 1)), var2 = c(rnorm(5, mean = 10, sd = 2)), var3 = c(rnorm(5, mean = 15, sd = 2)))
data

library(data.table)
data2 = melt(setDT(data), id.vars = c("id"), variable.name = "var")
data2

library(dplyr) # die Zeichenkette %>% meint 'und dann'
data3 = data2 %>% group_by(var) %>% summarise(mean = mean(value), sd = sd(value)); data3

library(ggplot2)
ggplot(data3, aes(x = factor(var), y = mean)) +
geom_bar(stat = 'identity', fill = 'green', colour = 'white') +
geom_errorbar(aes(ymin = mean - sd, ymax = mean + sd), width = 0.2, size = .5, color = 'grey55') +
xlab('')


SPSS, R, und andere Apps für die Statistik


SPSS

PSPP als freie Alternative vs. SPSS

R als kostenlose Alternative

R installieren

Weitere Links

SPSS, das Allround-Knife

Der Chi²-Test

Eine ANOVA zur Frage von Gruppenunterschieden (ANOVA = Analysis of Variance)

Der t-Test zur Frage von Gruppenunterschieden

Der t-Test zur Frage, ob sich Messwiederholungen unterscheiden

Der U-Test zur Frage von Gruppenunterschieden

R, ein kostenloses Programm mit starker Verbreitung

Übereinstimmung zweier Methoden graphisch anzeigen lassen (Bland-Altman Plot)

Ein lineares Vorhersagemodell rechnen (eine lineare mulitple Regression)

Eine Korrelation rechnen

Eine Rang-Korrelation (nach Spearman) rechnen

Fragen zusammenfassen (summieren, aggregieren)

Eine mixed ANOVA (Vergleich zwischen Gruppen, die eine Messwiederholung haben) rechnen

Ein Torten-/Kuchen-Diagramm in 3D

Ein Balken-/Histogramm erstellen (2 Gruppen im Vergleich)

Eine deskriptive Statistik erstellen

Eine ordinale Regression rechnen

Eine Inzidenzrate bewerten

Zwei Gruppen im Mittel mittels Python vergleichen (t-Test)

Zwei Gruppen (ohne Rückgriff auf die vielen Voraussetzungen des t-Tests) mittels Python vergleichen (U-Test)

Zwei binäre Reihen auf Änderung prüfen (McNemar-Test)

Eine Verlaufsgraphik von Mittelwerten mit Streubalken

Ein 2D-Kuchen mit ggplot

Eine Inzidenzrate mit R bewerten (passt meine Beobachtete zu der der Population, die ich aus der Literatur kenne?)

Zwei Inzidenzen mit R vergleichen

Eine Rang-Varianzanalyse (Rang-ANOVA, Kruskal-Wallis-Test) rechnen, d.h. 2 oder mehr Gruppen vergleichen

Eine Partialkorrelation rechnen, d.h. eine Korrelation (Eiskremverzehr und Sonnenbrand), aus der eine Drittvariable (Sonnenstunden) eliminiert ist

Einen Median-Test rechnen, d.h. weichen 2 Gruppen unterschiedlich stark vom Gesamt-Median ab?

Eine Regession zur Vorhersage bzw. Erklärung von Häufigkeitsdaten rechnen (Poisson-Regresion)

Ein einfaches Säulendiagramm zweier Gruppen



Ein Balken-/Histogramm erstellen (die Verteilung einer Population)

Ein Säulendiagramm, wenn wiederholt gemessen wird