II. Korrelation und Kausalität
1. Daten, Information und Wissen
Korrelation und Kausalität

- Verhalten sich zwei Datensätze “ähnlich”, so spricht man von Korrelation.
- Kausalität hingegen beschreibt einen Ursache-Wirkung-Zusammenhang.
Linktipp: Scheinkorrelationen
Der Blog Scheinkorrelation sammelt amüsante Beispiele. Auch wenn man Zusammenhänge zwischen zwei Variablen statistisch nachweisen kann, heißt das nicht automatisch, dass eine die andere beeinflusst hat. Eine solche Scheinkorrelation wäre z. B. der (statistisch nachweisbare) Zusammenhang von Habilitationen von Frauen im Bereich der Humanmedizin bzw. den Gesundheitswissenschaften (cyan) mit der Anzahl an Platin-Awards für Musikprodukte von Helene Fischer (blau).
Vielleicht ist aber auch nur uns der offensichtliche Zusammenhang entgangen *grübel*.
Korrelation: 0,9674; Quelle: scheinkorrelation.jimdo.com/
Weitere amüsante Beispiele sammelt der Blog 'Spurious Correlations'.
Datenvisualisierungen
Ziel einer “Datenvisualisierung” ist es, Informationen so aufzubereiten, dass sie für uns leichter zu interpretieren sind.
Dies ist eine wichtige Methode, mit deren Hilfe wir Muster, Trends oder Korrelationen finden können, die wir sonst vielleicht nicht entdeckt hätten.
Bei der Visualisierung von Daten geht es darum, eine Darstellung zu wählen, die es erlaubt, schnell die Kernaussage zu erfassen – ohne den Betrachter oder die Betrachterin in die Irre zu führen. Um den Trend einer Aktie zu visualisieren, ist ein einfaches Liniendiagramm ausreichend. Je mehr Parameter wir allerdings dazunehmen, desto komplexer wird unsere Visualisierung.
Beispiel: Periodensystem der Elemente
Ein schon älteres, aber sehr berühmtes Beispiel, kennen wir aus dem Chemieunterricht: das Periodensystem der Elemente. Es ist ein Beispiel dafür, wie aus Textdaten eine interessante und nützliche Darstellung werden kann, indem Zeilen und Spalten verwendet werden, um verschiedene Elemente zu gruppieren, und Farben, um darzustellen, ob es sich um ein Edelgas, Halbmetall, usw. handelt.
Das Periodensystem der Elemente ist ein klassisches Beispiel für Datenvisualisierungen.
Linktipp: Das Periodensystem für Datenvisualisierungen
Linktipp: Information is beautiful
Der Abschnitt Datenvisualisierungen stellt ein Derivat des unter CC-BY-SA stehenden CS Field Guide Kapitels dar.
Manipulation von Visualisierungen
Im folgenden Beispiel sind dreimal die selben Daten zu Populationen von Falken und Feldmäusen dargestellt. Lediglich der Ausschnitt der x- und y-Achse wurde verändert. Dennoch kommt man beim oberflächlichen Betrachten des Diagrammes schnell zu sehr unterschiedlichen Schlüssen!
Daher gilt der scherzhafte Merksatz: “Vertraue keinem Diagramm, das du nicht selbst gefälscht hast”.
![]() |
![]() |
![]() |
“In den letzten Jahren gab es kaum Veränderungen. Es besteht also kein Anlass zur Sorge.” |
“In den letzten Jahren gab es drastische Veränderungen! Wir müssen dringend etwas unternehmen!” |
“In den letzten Jahren gab es immer mehr Falken als Mäuse. Das wird auch so bleiben” |
Nennen Sie ein Beispiel aus der realen Welt, bei dem eine Korrelation zwischen zwei Variablen besteht, die jedoch keine kausale Beziehung impliziert.
Erstellen Sie eine neue Spalte (+ Symbol) und schreiben Sie Ihre Antworten darunter. Sie können ein Bild hinzufügen, indem Sie auf das „Bearbeiten“-Symbol auf der von Ihnen erstellten Karte klicken.