|
Eine Vorhersage ist meist so aufgebaut: Es gibt eine Zielvariable, die man vorhersagen möchte (diese ist in diesem Fall ordinal, d.h. mindestens ranggeordnet)
und es gibt mehrere vorhersagende Variablen. Die vorherzusagende Variable
heißt sinnigerweise meist Ziel- oder abhängige Variable, die Vorhersagenden nennt man Prädiktoren. Ein Beispiel: Man möchte eine Temperaturänderung vorhersagen. Diese Zielvariable soll in 3 ranggeordneten Abschnitten vorliegen (1 = die Tagestemperatur hüpft unter 20° C, 2 = sie springt zwischen 20 und 30° C und 3 = sie hüpft über 30°C). Ranggeordnet ist es deswegen, weil jede Kategorie höhere Temperaturen anzeigt, allerdings sind die Abschnitte nicht gleich breit (das wäre eine Intervallskala). Sie können auch nicht ins Verhältnis gesetzt werden (z.B. ist die Kategorie > 30° hat nicht die 1,5-fache Wertigkeit der untersten Kategorie, wenn das wäre, wäre es eine Rationalskala, die Kelvin-Skala wäre eine solche). Als Prädiktoren in unserem Beispiel zählt man größere Wolken und die Sonnenstunden am Tag, um einen Temperatursprung vorherzusagen. Diese Daten sehen so aus
Anmerkung: Werte der Temperaturerwartung: 1 = kleiner 20° C, 2 = zwischen, 20 und 30° C und 3 = 30°C oder wärmer Ich würde empfehlen, die ordinale Regression mit dem R zu rechnen. Kopieren Sie diese Zeilen in Ihr R-Studio.
data = data.frame(wolken = c(10, 8, 9, 9, 9, 4, 4, 4, 4, 1, 1, 1, 3, 2), sonnenstunden = c(5,10,8,7,2,1,2,3,1,1,2,3,2,1), temperaturaenderung = c(1,3,3,3,1,1,1,2,1,1,3,2,1,2))
An der Spalte "p-value" sieht man (wenn p unter 0.05 liegt), dass 2 Prädiktoren signifikant sind (die Wolkenzahl und die Sonnenstunden, ich gebe natürlich zu, das Beispiel ist konstruiert). Diese erlauben eine Vorhersage auf einen Temperatursprung (der, wie gesagt in ordinalen Kategorien vorlieg). Mit eine kleinen Einschränkung: Die Vorhersagbarkeit betrifft nur den Sprung von mittlerer Temperatur auf die hohe (d.h. nur der Sprung von Stufen 2 auf 3 (2|3) läßt sich vorhersagen) |