2014-10-23 #Butterkuchen :-) #ExIF14, Teil IV “Wie zwei Merkmale miteinander variieren”
Es ist soweit... Ich habe mich davor gefürchtet und nun ist es passiert. Ich habe den Anschluss verloren und stecke im Dschungel der Datenanalyse fest. Dabei begann alles ganz harmlos....
Bivariabe Verteilung
Das klingt nicht schwer, und ist es auch nicht. Zunächst nimmt man eine Hypothese. Diese muss eine Richtung und eine Stärke der variablen vorgeben. z.B. Je größer der Lernerfolg der Teilnehmenden, desto Besser ist die Bewertung des Kurses. Damit die Variablen verglichen werden können, müssen sie zunächst recodiert werden. d.h. falls die Daten nicht entsprechend vorliegen müssen sie so umgeschrieben werden das eine hohe Zahl eine hohe Zustimmung bedeutet. Als nächstes findet die Indexkonstruktion statt. Alle Variablen werden aufaddiert und durch die Anzahl der Items geteilt. Man erhält eine neue Variable, den Index. Dieser Schritt fällt natürlich nur an, falls es mehrere Variablen gibt die gemeinsam einen Sachverhalt darstellen.
Beispiel "Podcastreihe Medienkompetenz"
Person a) 1+0+0+0=4 4:4=1 Indexvariable (Lernerfolg)=1 Person b) 0+0+1+1=2 2:4=0,5 Lernerfolg=0,5
Ich frage mich an dieser Stelle ob es für die weitere Berechnung zwingend nötig ist einen Index zu bilden... Könnte man nicht auch mit der Summe weiterrechnen?
Damit man eine Bivariable Verteilung erhält braucht man natürlich noch einen zweiten Wert. Diese Werte stellen einmal eine unabhängige Variable/ Prädiktor (X) und eine abhängige Variable/ Kriterium (Y) dar.
Für einen ersten Überblick lassen sich diese Wortpaare in einem Streudiagramm darstellen. Dieses zeigt die Wertpaare als Punkte an. Es gibt einen ersten Überblick über generelle Tendenzen und dient einer ersten Hypothesenprüfung. Die XY-Trendgerade weist nach ob ein empirischer Zusammenhang besteht. Die Punkte bilden eine Elypse. Die weite bzw. enge der Form gibt Auskunft über die Stärke des Zusammenhanges. Das Streudiagramm hilft demnach der Interpretation sowie einer ersten Beschreibung.
Die Superzahl
Welche Anforderungen muss eine Superzahl erfüllen, die die Quantifizierung der Stärke eines Zusammenhanges ermöglicht?
Nach Galtung (1970)müssen folgende allgemeinen Anforderungen erfüllt werden. a) Sie muss in einem normierten Wertebereich liegen. b) Die Richtung der gemeinsamen Entwicklung muss über das Vorzeichen zu identifizieren sein. c) Sie muss eine klare inhaltliche Interpretation ermöglichen.
Diese Supermaßzahl (r) muss weiterhin folgende Anforderungen erfüllen: positive funktionale Beziehung: r=+1 positive korrelative Beziehung: r>0 keine korrelative Beziehung: r=0 negative korrelative Beziehung: r<1 negative funktionale Beziehung: r=-1 Hierbei wird zwischen linearen, nicht linearen und keinen Zusammenhängen unterschieden. Dies drückt sich dadurch aus, dass die Punktwolke des Streudiagramms entweder steigt, fällt, keine Tendenzen hat oder eine andere Form aufweist.
An dieser Stelle frage ich mich ob weitergerechnet werden muss, wenn man anhand des Streudiagrammes schon sieht, dass es keine Zusammenhänge gibt. Und zeigen sich diese Zusammenhänge erst ab einer gewissen Menge an Variablenpaaren?
Wie können X und Y verknüpft werden? Diese einfache Frage führte in einen wahren Formeldschungel den ich an dieser Stelle leider nicht wiedergeben kann, da Tumblr mich nicht lässt :( Es sei dazu so viel gesagt, dass ich durchaus verstand worum es ging. Nämlich Formeln zum Berechnen der steigenden, fallenden oder Zusammenhanglosen Wolken. Nur wurden aus einer Formel fiele, und als es dann hieß es gäbe eine Definitionsformel und eine Berechnungsformel war ich hoffnungslos versunken. Ich glaube ich habe im Dschungel der Datenanalyse aus versehen den Sumpf der Formeln gefunden...
Im Bemühen mich aus dem Sumpf zu ziehen habe ich versucht eigene Daten auszuwerten um den Formeln auf die Spur zu kommen. Leider waren meine Daten nicht sehr mitteilungsbedürftig.
Beispiel "Podcastreihe Medienkompetenz"
Lernerfolg/ Bewertung der Podcastreihe:
Pearson Korrelation (r) -,03
Keine Korrelation, ja, das dachte ich mir auch schon, als ich das Streudiagramm betrachtet hatte.
Bewertungstabelle von r
0,00 - 0,05 keine Korrelation
>0,05 - 0,20 schwache Korrelation
>0,20 - 0,50 mittlere Korrelation
>0,50 - 0,70 starke Korrelation
>0,70 - 1,00 sehr starke Korrelation
Alles in allem war der Hinweis, man solle ein Datenanalyseprogramm verwenden absolut richtig... Nur leider kann man dabei nicht überprüfen ob und wie genau gerechnet wird.
Falls ihr Fehler findet oder euch auch gerade mit diesem Thema auseinandersetzt, schreibt mir doch auf Twitter @Bierjacqueline.
Literatur:
Galtung, J. (1970). Theory and methods of social research (Rev. ed.). Oslo: Universitetsfrolaget.














