Wenn Sie Fragen stellen möchten,
einfach per Mail, direkt oder per WhatsApp
0178 87 55 145 oder
0157 740 58 477.
Ich beantworte Fragen gerne und gebe gern den einen oder anderen Tipp. Wenn Sie etwas von mir rechnen lassen möchten, bräuchte ich Einblick in Ihre Daten (Excel, SPSS-Daten) und eine Liste Ihrer Fragen (eine Word-Seite).

Programmieren in der Statistik, was sollte man anwenden, worin sollte man sich einarbeiten?


Statistik-Programmieren


Die richtige Statistiksoftware hängt stark ab, welche Vorkenntnisse Sie haben, was Ihr letztliches Ziel ist (Akademie, Industrie) und wie Ihr Budget ist.
R und Python sind aktuell führend, bieten quasi Antworten auf nahezu jede Fragestellung und sind zudem kostenlos. SAS ist Standard in der Industrie, beispielsweise, wenn Sie später bei Arzneimittelstudien beitragen möchten. SPSS und Jamovi sind am besten für "Point-and-Click". Jamovi ist ein Ableger von R mit schöner grafischer Oberfläche. Aber Achtung: Schöne Oberflächen lösen keine statistischen Probleme oder beantworten kniffelige Fragen.

Ich selbst habe mit SAS in der Pharmaindustrie angefangen, bin dann zu dem sehr teuren SPSS und letztlich dann zum R gewechselt (aktuell mein absoluter Favourit). Gründe waren letztlich Kosten (0 €), viele R-Lösungen und R-Beispiele im Netz, die Lernkurve (erst steil, dann sehr flach, bis fast selbsterklärend), tolle Grafiken, gut konfektionierbare Ergebnis-Tabellen, einfache Einbindung in automatisierte Reports und Dashboards, und die Schnittstellen zu Datenbanken funktionieren tatsächlich zuverlässig. Und die Grafik (sagte ich das schon?) ist der reine Wahnsinn.

Software Programmier-intensitätKostenHauptfokusLernkurveStärken
R Hoch (Skripting) Kostenlos Statistik, Data Science, viele Libraries für nahezu jedes Problem Steil Beste Visualisierung, enorme Paketauswahl, reproduzierbar
Python Hoch (Programmieren) Kostenlos Maschinelles Lernen, KI, Data Mittel Vielseitig (Allzweck), ML-Integration, hohe Performance
SAS Hoch (SAS Code) Sehr Hoch Enterprise Statistik, Pharma Mittel-Steil Datensicherheit, große Datenmengen, exzellenter Support
SPSS Niedrig (GUI/Syntax) Hoch Sozialwissenschaften, Survey Flach Einfach, keine Codierung nötig, gut für Standard-Tests
Jamovi Niedrig-Mittel (GUI+R) Kostenlos Psychologie, Lehre Sehr Flach Kostenlose SPSS-Alternative, R-Syntax-Anzeige
NCSS Niedrig (GUI) Mittel Medizin, Studienplanung Flach Gutes GUI für Power-Analysen und Stichprobenzahl


SPSS, R, und andere Apps für die Statistik


SPSS

PSPP als freie Alternative vs. SPSS

R als kostenlose Alternative

Vergleich von R vs SPSS vs. Jamovi vs SAS

R installieren

Weitere Links

SPSS, das Allround-Knife

Der Chi²-Test

Eine ANOVA zur Frage von Gruppenunterschieden (ANOVA = Analysis of Variance)

Der t-Test zur Frage von Gruppenunterschieden

Der t-Test zur Frage, ob sich Messwiederholungen unterscheiden

Der U-Test zur Frage von Gruppenunterschieden

R, ein kostenloses Programm mit starker Verbreitung

Übereinstimmung zweier Methoden graphisch anzeigen lassen (Bland-Altman Plot)

Ein lineares Vorhersagemodell rechnen (eine lineare mulitple Regression)

Eine Korrelation rechnen

Eine Rang-Korrelation (nach Spearman) rechnen

Fragen zusammenfassen (summieren, aggregieren)

Eine mixed ANOVA (Vergleich zwischen Gruppen, die eine Messwiederholung haben) rechnen

Ein Torten-/Kuchen-Diagramm in 3D

Ein Balken-/Histogramm erstellen (2 Gruppen im Vergleich)

Eine deskriptive Statistik erstellen

Eine ordinale Regression rechnen

Eine Inzidenzrate bewerten

Zwei Gruppen im Mittel mittels Python vergleichen (t-Test)

Zwei Gruppen (ohne Rückgriff auf die vielen Voraussetzungen des t-Tests) mittels Python vergleichen (U-Test)

Zwei binäre Reihen auf Änderung prüfen (McNemar-Test)

Eine Verlaufsgraphik von Mittelwerten mit Streubalken

Ein 2D-Kuchen mit ggplot

Eine Inzidenzrate mit R bewerten (passt meine Beobachtete zu der der Population, die ich aus der Literatur kenne?)

Zwei Inzidenzen mit R vergleichen

Eine Rang-Varianzanalyse (Rang-ANOVA, Kruskal-Wallis-Test) rechnen, d.h. 2 oder mehr Gruppen vergleichen

Eine Partialkorrelation rechnen, d.h. eine Korrelation (Eiskremverzehr und Sonnenbrand), aus der eine Drittvariable (Sonnenstunden) eliminiert ist

Einen Median-Test rechnen, d.h. weichen 2 Gruppen unterschiedlich stark vom Gesamt-Median ab?

Eine Regession zur Vorhersage bzw. Erklärung von Häufigkeitsdaten rechnen (Poisson-Regresion)

Ein einfaches Säulendiagramm mehrerer Gruppen

Ein Balken-/Histogramm erstellen (die Verteilung einer Population)

Ein Säulendiagramm, wenn wiederholt gemessen wird

Vorteile einer randomisierten Studie

Vorteile von Apriori-Hypothesen

Ein Boxplot für mehrere Gruppen

Eine 100-Jährigen-Studie, das Problem vorgefundener Gruppen und riskante Schlussfolgerungen

Statistik, womit sollte man (wenn man es denn muss) programmieren?