Wenn Sie Fragen stellen möchten,
einfach per Mail, direkt oder per WhatsApp
0178 87 55 145 oder
0157 740 58 477.
Ich beantworte Fragen gerne und gebe gern den einen oder anderen Tipp. Wenn Sie etwas von mir rechnen lassen möchten, bräuchte ich Einblick in Ihre Daten (Excel, SPSS-Daten) und eine Liste Ihrer Fragen (eine Word-Seite).

Welche Vorteile hat R im Vergleich zu SPSS vs. Jamovi vs SAS


Was macht all diese Pakete so unschätzbar?

Pakete im Vergleich

Die am häufigsten genutzten Pakete, um sich mit Statistik zu beschäftigen (oder wahlweise, um sich damit herumzuärgern) sind meiner Erfahrung und persönlichen Meinung nach (gilt für diese gesamte Seite) das R, das SPSS, dann das Jamovi und letztlich auch das SAS. Hier sind Vor- und Nachteile:

FeatureR (mit RStudio)SPSS (IBM)JamoviSAS
TypOpen-Source (was meistens heißt: Null Kosten)kommerzielle mit GUI (graphical user interface)Open-Source GUI (basiert letztlich auf R)Kommerzielle Software (Enterprise)
Kostenkostenlos (downloaden, loslegen)sehr, sehr teuer (Sie müssen eine Lizenz kaufen)kostenlossehr, sehr teuer (Sie müssen eine Lizenz kaufen, Preise nur auf direkte Nachfrage)
Lernkurvesteil, wenn man sich auf das Scripten von Ideen (und Statistiken) einlassen kannflach (Point-and-Click aus den Menüs heraus), meist sehr schwer nachzuvollziehen, was passiertsehr flach (einfach)steil (eigene Syntax)
Vorteileextrem flexibel, beste Plots/Charts (ggplot2), große Community, reproduzierbareinfache Bedienung, Goldstandard in Sozialwissenschaften, ordentliche Berichte, diese sind aber haarig in der Nacharbeitungintuitive Oberfläche, R-Code wird parallel generiert, ideal für Lehresehr zuverlässig bei großen Datensätzen (Big Data), sicher, starker Support, gilt als validiert (Validierungsdoku bis dato von mir noch nicht auffindbar)
Nachteilezeitintensive Einarbeitungteuer, weniger flexibel für komplexe/neue Analysen, Grafikerstellung schwierig bis undurchführbarweniger Funktionen als R/SPSS, noch in der Entwicklunghohe Kosten, veraltete Oberfläche, komplexe Syntax, sehr frustrierende Einarbeitung, Grafikerstellung schwierig und extrem zeitintensiv
Steuerung größerer Projekteüber Scripte und bei Einarbeitung ins Programmieren vergleichsweise gut steuerbarmachbar, schwierig durch teils 40-Jahre alte Syntax hier gilt das gleiche wie bei Rgut machbar, schnelle Lauffähigkeit, Steuerung über Macros haarig, schwierig und extrem zeitintensiv
womit genau steuert man größere ProjekteScripte, eigene funktionenSyntax, Pythonhier gilt das gleiche wie bei RScripte, Macros (haarig, schwierig, zeitintensiv)
Best-ofData Science, Data Viz, Akademische ForschungMarktforschung, Sozialwissenschaften, EinsteigerLehre, schnelle Analysen, SPSS-AlternativeMedizin, Finanzen, Enterprise-Level, Big Data

Fazit und Zusammenfassung

R ist aktuell der Standard an Universitäten, für moderne Data Science und demnächst auch für klinische Studien. Null Euro Kosten ist natürlich immer ein unschlagbares Argument. R bietet unbegrenzte Möglichkeiten, erfordert aber die Bereitschaft, sich auf das Scripten einzulassen. Dafür wird man aber auch belohnt. Hier z.B. ein einfaches Beispiel für einen Chi²-Test, es genügt ein Einzeiler. 4 Häufigkeiten eingeben (siehe rote Zeile weiter unten), Zeile abschicken, p-Wert ablesen, fertig. Schneller geht es kaum. Wenn Sie einen exakten Fisher-Test brauchen, weil Ihre Häufigkeiten klein sind, ersetzen Sie in dem Code einfach das 'chisq' durch ein 'fisher' und fertig ist (es reicht, lediglich den p-Wert abzulesen).
SPSS ist ideal, wenn man eine vertraute, menübasierte Oberfläche ohne Programmierung benötigt. Wird oft in der akademischen Forschung genutzt.
Jamovi: Eine moderne, kostenlose Alternative zu SPSS, die auf R basiert. Es ermöglicht den einfachen Einstieg über eine grafische Oberfläche und ist ideal, um R zu lernen, da es den R-Code anzeigt.
SAS: Der "Panzer" unter den Statistikprogrammen. Sehr etabliert, sehr stabil, sicher und ideal für sehr große Datenmengen in der Industrie (z. B. klinische Studien). Ich höre immer, es sei 'validiert', suche die Validierungsdokumentation allerdings bis heute (hatte bisher noch kein Finderglück).


Hier der R-Code für das obige R-Beispiel. Es geht um die Frage, ob sich 2 Gruppen (10 vs 30 Inzidenz-Fälle), in ihren Inzidenz-Raten unterscheiden. Und ja, in dem Beispiel tun sie dies (p < 0.05).

chisq.test(matrix(c(10,20,30,20), nrow = 2))