Wie rechnet man eine Vorhersage am Beispiel der linearen Regression?
Eine Vorhersage ist meist so aufgebaut: Es gibt eine Zielvariable, die man vorhersagen möchte und es gibt mehrere vorhersagende Variablen. Die vorherzusagende Variable
heißt sinnigerweise meist Ziel- oder abhängige Variable, die Vorhersagenden nennt man Prädiktoren.Ein Beispiel für eine lineare RegressionEin Beispiel: Man möchte die Temperaturänderung vorhersagen (Zielvariable). Als Prädiktoren zählt man größere Wolken und die Sonnenstunden am Tag. Daraus möchte man die Temperaturänderung vorhersagen, einerseits ob das in signifikanter Weise geht (Gesamtmodell), welcher der Prädiktoren dafür verantwortlich ist (p-Werte) und wie stark die Vorhersage ist (Koeffizienten bzw. "estimate"). Diese Daten für das Mini-Beispiel sehen so aus
Die R-BefehlszeilenIch würde empfehlen, die Regression mit dem R zu rechnen. Kopieren Sie diese Zeilen in Ihr R-Studio.
data = data.frame(wolken = c(5, 10, 8, 7, 2, 3, 2, 4), sonnenstunden = c(10,8,9,9,9,9,9,9), temperaturaenderung = c(-2,4,0,3,-5,-6,-7,-5)) Die R-Ausgabe (nur die wichtigen Teile)Nur wenige Punkte in der Ausgabe sind für die Interpretation wichtig (nur zwei):
InterpretationAn der Spalte "Pr(>|t|)" sieht man (wenn p unter 0.05 liegt), dass nur ein Prädiktor ein signifikanter ist (die Wolkenzahl).Das Gesamtmodell ist (letzte Zeile der Ausgabe) ist mit p = 0.004946 ebenfalls signifikant, d.h. insgesamt funktioniert eine Vorhersage. |