12  Kausalinferenz

12.1 Lernsteuerung

12.1.1 R-Pakete

Für dieses Kapitel benötigen Sie folgende R-Pakete:

12.1.2 Lernziele

Nach Absolvieren des jeweiligen Kapitels sollen folgende Lernziele erreicht sein.

Sie können …

  • erklären, wann eine Kausalaussage gegeben eines DAGs berechtigt ist
  • die “Atome” der Kausalität eines DAGs benennen
  • “kausale Hintertüren” schließen

12.2 Statistik, was soll ich tun?

12.2.1 Studie A: Östrogen

12.2.1.1 Medikament einnehmen?

Mit Blick auf Tabelle 12.1: Was raten Sie dem Arzt? Medikament einnehmen, ja oder nein?

Tabelle 12.1:

Daten zur Studie A

Gruppe Mit Medikament Ohne Medikament
Männer 81/87 überlebt (93%) 234/270 überlebt (87%)
Frauen 192/263 überlebt (73%) 55/80 überlebt (69%)
Gesamt 273/350 überlebt (78%) 289/350 überlebt (83%)

Die Daten stammen aus einer (fiktiven) klinischen Studie, \(n=700\), hoher Qualität (Beobachtungsstudie). Bei Männern scheint das Medikament zu helfen; bei Frauen auch. Aber insgesamt (Summe von Frauen und Männern) nicht?! Was sollen wir den Arzt raten? Soll er das Medikament verschreiben? Vielleicht nur dann, wenn er das Geschlecht kennt (Pearl, Glymour, und Jewell 2016)?

12.2.1.2 Kausalmodell zur Studie A

In Wahrheit sehe die kausale Struktur so aus: Das Geschlecht (Östrogen) hat einen Einfluss (+) auf Einnahme des Medikaments und auf Heilung (-). Das Medikament hat einen Einfluss (+) auf Heilung. Betrachtet man die Gesamt-Daten zur Heilung, so ist der Effekt von Geschlecht (Östrogen) und Medikament vermengt (konfundiert, confounded). Die kausale Struktur, also welche Variable beeinflusst bzw. nicht, ist in Abbildung 12.1 dargestellt.

Abbildung 12.1: Zwei direkte Effekte (gender, drug) und ein indirekter Effekt (gender über drug) auf recovery

Betrachtung der Gesamtdaten zeigt in diesem Fall einen konfundierten Effekt: Geschlecht konfundiert den Zusammenhang von Medikament und Heilung.

Wichtig

Betrachtung der Teildaten (d.h. stratifiziert pro Gruppe) zeigt in diesem Fall den wahren, kausalen Effekt. Stratifizieren ist also in diesem Fall der korrekte, richtige Weg. Achtung: Das Stratifizieren ist nicht immer und nicht automatisch die richtige Lösung. Stratifizieren bedeutet, den Gesamtdatensatz in Gruppen oder “Schichten” (“Strata”)

12.2.2 Studie B: Blutdruck

12.2.2.1 Medikament einnehmen?

Mit Blick auf Tabelle 12.2: Was raten Sie dem Arzt? Medikament einnehmen, ja oder nein?

Tabelle 12.2:

Daten zur Wirksamkeit eines Medikaments (Studie B)

Gruppe Ohne Medikament Mit Medikament
geringer Blutdruck 81/87 überlebt (93%) 234/270 überlebt (87%)
hoher Blutdruck 192/263 überlebt (73%) 55/80 überlebt (69%)
Gesamt 273/350 überlebt (78%) 289/350 überlebt (83%)

Die Daten stammen aus einer (fiktiven) klinischen Studie, \(n=700\), hoher Qualität (Beobachtungsstudie). Bei geringem Blutdruck scheint das Medikament zu schaden. Bei hohem Blutdrck scheint das Medikamenet auch zu schaden. Aber insgesamt (Summe über beide Gruppe) nicht, da scheint es zu nutzen?! Was sollen wir den Arzt raten? Soll er das Medikament verschreiben? Vielleicht nur dann, wenn er den Blutdruck nicht kennt? Pearl, Glymour, und Jewell (2016)

12.2.2.2 Kausalmodell zur Studie B

Das Medikament hat einen (absenkenden) Einfluss auf den Blutdruck. Gleichzeitig hat das Medikament einen (toxischen) Effekt auf die Heilung. Verringerter Blutdruck hat einen positiven Einfluss auf die Heilung. Sucht man innerhalb der Leute mit gesenktem Blutdruck nach Effekten, findet man nur den toxischen Effekt: Gegeben diesen Blutdruck ist das Medikament schädlich aufgrund des toxischen Effekts. Der positive Effekt der Blutdruck-Senkung ist auf diese Art nicht zu sehen.

Das Kausalmodell ist in Abbildung 12.2 dargestellt.

Abbildung 12.2: Drug hat keinen direkten, aber zwei indirekte Effekt auf recovery, einer davon ist heilsam, einer schädlich

Betrachtung der Teildaten zeigt nur den toxischen Effekt des Medikaments, nicht den nützlichen (Reduktion des Blutdrucks).

Wichtig

Betrachtung der Gesamtdaten zeigt in diesem Fall den wahren, kausalen Effekt. Stratifizieren wäre falsch, da dann nur der toxische Effekt, aber nicht der heilsame Effekt sichtbar wäre.

12.2.3 Studie A und B: Gleiche Daten, unterschiedliches Kausalmodell

Vergleichen Sie die DAGs Abbildung 12.1 und Abbildung 12.2, die die Kausalmodelle der Studien A und B darstellen: Sie sind unterschiedlich. Aber: Die Daten sind identisch.

Kausale Interpretation - und damit Entscheidungen für Handlungen - war nur möglich, da das Kausalmodell bekannt ist. Die Daten alleine reichen nicht. Gut merken.

12.2.4 Sorry, Statistik: Du allein schaffst es nicht

Statistik alleine reicht nicht für Kausalschlüsse. 🧟 Statistik plus Theorie erlaubt Kausalschlüsse. 📚➕📊 🟰 🤩

Wichtig

Für Entscheidungen (“Was soll ich tun?”) braucht man kausales Wissen. Kausales Wissen basiert auf einer Theorie (Kausalmodell) plus Daten.

12.2.5 Vertiefung1

12.2.5.1 Studie C: Nierensteine

Nehmen wir an, es gibt zwei Behandlungsvarianten bei Nierensteinen, Behandlung A und B. Ärzte tendieren zu Behandlung A bei großen Steinen (die einen schwereren Verlauf haben); bei kleineren Steinen tendieren die Ärzte zu Behandlung B.

Sollte ein Patient, der nicht weiß, ob sein Nierenstein groß oder klein ist, die Wirksamkeit in der Gesamtpopulation (Gesamtdaten) oder in den stratifizierten Daten (Teildaten nach Steingröße) betrachten, um zu entscheiden, welche Behandlungsvariante er (oder sie) wählt?

Die Größe der Nierensteine hat einen Einfluss auf die Behandlungsmethode. Die Behandlung hat einen Einfluss auf die Heilung. Damit gibt es eine Mediation (“Kette”) von Größe \(\rightarrow\) Behandlung \(\rightarrow\) Heilung. Darüber hinaus gibt es noch einen Einfluss von Größe der Nierensteine auf die Heilung.

Das Kausalmodell ist in Abbildung 12.3 dargestellt; Abbildung 12.4 visualisiert alternativ.

Sollte man hier size kontrollieren, wenn man den Kausaleffekt von treatment schätzen möchte? Oder lieber nicht kontrollieren?

Abbildung 12.3: DAG zur Nierenstein-Studie

Abbildung 12.4: DAG zur Nierenstein-Studie in zweiter Darstellungsform

Ja: In diesem Fall sollte man size kontrollieren, denn man ist am Effekt des treatments interessiert. Würde man nicht size kontrollieren, bekäme man den “vermengten” Effekt von size und treatment, also keine (belastbare) Aussage über den Effekt der Behandlung.

12.2.5.2 Mehr Beispiele

Nehmen Sie Bezug zu folgenden Aussagen:

Studien zeigen, dass Einkommen und Heiraten (bzw. verheiratete sein) hoch korrelieren. Daher wird sich dein Einkommen erhöhen, wenn du heiratest.

Studien zeigen, dass Leute, die sich beeilen, zu spät zu ihrer Besprechung kommen. Daher lieber nicht beeilen, oder du kommst zu spät zu deiner Besprechung.

12.2.6 Zwischenfazit

Bei Beobachtungsstudien ist aus den Daten alleine nicht herauszulesen, ob eine Intervention wirksam ist, ob es also einen kausalen Effekt von der Intervention (angenommen Ursache) auf eine AV (Wirkung) gibt. Damit ist auch nicht zu erkennen, welche Entscheidung zu treffen ist. Nur Kenntnis des Kausalmodells zusätzlich zu den Daten erlaubt, eine Entscheidung sinnvoll zu treffen.

Bei experimentellen Daten ist die Kenntnis des Kausalmodells nicht nötig (wenn das Experiment handwerklich gut gestaltet ist): Das Randomisieren der Versuchspersonen zu Gruppen und das Kontrollieren der Versuchsbedingungen sorgen dafür, dass es keine Konfundierung gibt.

12.3 Konfundierung

12.3.1 Datensatz ‘Hauspreise im Saratoga County’

Wir nutzen den Datensatz Saratoga County; s. Tabelle 12.3. Hier gibt es eine Beschreibung des Datensatzes.

d_path <- "https://vincentarelbundock.github.io/Rdatasets/csv/mosaicData/SaratogaHouses.csv"
Tabelle 12.3: Saratoga-County-Datensatz
price livingArea bedrooms waterfront
132500 906 2 No
181115 1953 3 No
109000 1944 4 No
155000 1944 3 No
86060 840 2 No

12.3.2 Immobilienpreise in einer schicken Wohngegend vorhersagen

“Finden Sie den Wert meiner Immobilie heraus! Die Immobilie muss viel wert sein!”

🧑 Das ist Don, Immobilienmogul, Auftraggeber.

Das finde ich heraus. Ich mach das wissenschaftlich.

👩 🔬 Das ist Angie, Data Scientistin.

12.3.3 Modell 1: Preis als Funktion der Anzahl der Zimmer

“Hey Don! Mehr Zimmer, mehr Kohle!” 👩 🔬

Modell 1 (m1) modelliert den Hauspreis als Funktion der Zimmerzahl, s. Abbildung 12.5.

Abbildung 12.5: Modell m1

“Jedes Zimmer mehr ist knapp 50 Tausend wert. Dein Haus hat einen Wert von etwa 150 Tausend Dollar, Don.”

👩

Zu wenig! 🤬

🧑

Berechnen wir das Modell m1; der Punktschätzer des Parameters bedroom steht in Tabelle 12.4.

m1 <- stan_glm(price ~ bedrooms,
               refresh = 0,
               seed = 42,
               data = d)

point_estimate(m1)
Tabelle 12.4: Parameter für m1
Parameter Median Mean MAP Effects Component
(Intercept) 60009.99 59849.74 60664.24 fixed conditional
bedrooms 48158.27 48216.77 47909.81 fixed conditional

point_estimates(modell) gibt die Punktschätzer der Parameter eines Modells zurück, aber nicht die Schätzbereiche. Möchten Sie beides, können Sie die Funktion parameters(modell) nutzen.2

Mit estimate_predictions können wir Vorhersagen berechnen (bzw. schätzen; die Vorhersagen sind ja mit Ungewissheit verbunden, daher ist “schätzen” vielleicht das treffendere Wort). Tabelle 12.5 zeigt den laut m1 vorhergesagten Hauspreis für ein Haus mit 2 Zimmern.

dons_house <- tibble(bedrooms = 2)
estimate_prediction(m1, data = dons_house)
Tabelle 12.5: Vorhersage des Hauspreises für ein Haus mit 2 Zimmern
bedrooms Predicted SE 95% CI
2.00 1.58e+05 89053.60 (-11396.62, 3.36e+05)

Variable predicted: price

12.3.4 Don hat eine Idee

“Ich bau eine Mauer! Genial! An die Arbeit, Angie!” 🧑

Don hofft, durch Verdopplung der Zimmerzahl den doppelten Verkaufspreis zu erzielen. Ob das klappt?

“Das ist keine gute Idee, Don.”

👩

Berechnen wir die Vorhersagen für Dons neues Haus (mit den durch Mauern halbierten Zimmern), s. Tabelle 12.6.3

dons_new_house <- tibble(bedrooms = 4)
estimate_prediction(m1, dons_new_house)
predict(m1, newdata = dons_new_house)
Tabelle 12.6: Vorhergesagter Hauspreis laut m1 für ein Haus mit 4 Zimmern
bedrooms Predicted SE 95% CI
4.00 2.51e+05 88063.92 (79913.23, 4.27e+05)

Variable predicted: price

Mit 4 statt 2 Schlafzimmer steigt der Wert auf 250k, laut m1, Abbildung 12.5.

“Volltreffer! Jetzt verdien ich 100 Tausend mehr! 🤑 Ich bin der Größte!” 🧑

Hinweis

Zur Erinnerung: “4e+05” ist die Kurzform der wissenschaftlichen Schreibweise und bedeutet: \(4 \cdot 100000 = 4\cdot10^5 = 400000\)

12.3.5 R-Funktionen, um Beobachtungen vorhersagen

estimate_prediction(m1, dons_new_house) erstellt Vorhersageintervalle, berücksichtigt also zwei Quellen von Ungewissheit:

  • Ungewissheiten in den Parametern (Modellkoeffizienten, \(\beta_0, \beta_1, ...\))
  • Ungewissheit im “Strukturmodell”: Wenn also z.B. in unserem Modell ein wichtiger Prädiktor fehlt, so kann die Vorhersagen nicht präzise sein. Fehler im Strukturmodell schlagen sich in breiten Schätzintervallen (bedingt durch ein großes \(\sigma\)) nieder.

estimate_expectation(m1, dons_new_house) erstellt Konfidenzintervalle. berücksichtigt also nur eine Quelle von Ungewissheit:

  • Ungewissheiten in den Parametern (Modellkoeffizienten, \(\beta_0, \beta_1, ...\))

Die Schätzbereiche sind in dem Fall deutlich kleiner, s. Tabelle 12.7.

estimate_expectation(m1, dons_new_house)

Tabelle 12.7: ?(caption)

(a) Model-based Expectation
bedrooms Predicted SE 95% CI
4.00 2.53e+05 3097.48 (2.47e+05, 2.59e+05)

Variable predicted: price

Ungewissheit für die Parameter, also die Regressionsgerade, nicht die Beobachtungen

12.3.6 Modell 2

Berechnen wir das Modell m2: price ~ bedrooms + livingArea. Tabelle 12.8 gibt den Punktschätzer für die Koeffizienten wider.

m2 <- stan_glm(price ~ bedrooms + livingArea, 
               data = d, 
               seed = 42,
               refresh = 0)

point_estimate(m2, centrality = "median")
Tabelle 12.8: Parameter (Punktschätzer, keine Schätzung der Ungewissheit) von m2
Parameter Median
(Intercept) 36780.69
bedrooms -14238.34
livingArea 125.41

Was sind die Vorhersagen des Modell? Tabelle 12.9 gibt Aufschluss für den laut m2 vorhersagten Kaufpreis eines Hauses mit 4 Zimmern und 1200 Quadratfuß Wohnfläche; Tabelle 12.10 gibt die Schätzung (laut m2) für den Preis eines Hauses mit 2 Zimmern (und der gleichen Wohnfläche). Die Vorhersage erhält man mit dem Befehl predict():

predict(m2, newdata = data.frame(bedrooms = 4, livingArea = 1200))
##        1 
## 130335.6
Tabelle 12.9: Vorhersage von m2 für ein Haus mit 4 Zimmern und 1200 Einheiten Wohnfläche
bedrooms livingArea Predicted SE CI_low CI_high
4 1200 129911.4 67927.32 787.9515 266296.2
Tabelle 12.10: Vorhersage von m2 für ein Haus mit 2 Zimmern und 1200 Einheiten Wohnfläche
bedrooms livingArea Predicted SE CI_low CI_high
2 1200 159677.7 68454.54 22870.85 298352.2

Andere, aber ähnliche Frage: Wieviel kostet ein Haus mit sagen wir 4 Zimmer gemittelt über die verschiedenen Größen von livingArea? Stellen Sie sich alle Häuser mit 4 Zimmern vor (also mit verschiedenen Wohnflächen). Wir möchten nur wissen, was so ein Haus “im Mittel” kostet. Wir möchten also die Mittelwerte pro bedroom schätzen, gemittelt für jeden Wert von bedroom über livingArea. Die Ergebnisse stehen in Tabelle 12.11 und sind in Abbildung 12.6 visualisiert.

estimate_means(m2, at = "bedrooms", length = 7)
Tabelle 12.11: Vorhersagen des Preises von Häusern mit verschiedener Zimmerzahl gemittelt über die verschiedenen Werte der Wohnfläche; basierend auf m2.
bedrooms Mean CI_low CI_high pd
1 242651.0 230896.5 254355.9 1
2 228388.9 221591.6 235187.0 1
3 214204.4 210892.6 217394.7 1
4 199922.2 194505.8 205326.3 1
5 185698.8 175731.2 195701.2 1
6 171469.8 156519.4 186377.2 1
7 157206.9 137108.9 177051.6 1

Abbildung 12.6: Hauspreis als Funktion der Zimmerzahl, laut m2

“Die Zimmer zu halbieren, hat den Wert des Hauses verringert, Don!”

👩

“Verringert!? Weniger Geld?! Oh nein!”

🧑

12.3.7 Die Zimmerzahl ist negativ mit dem Preis korreliert

… wenn man die Wohnfläche (Quadratmeter) kontrolliert, s. Abbildung 12.7.

“Ne-Ga-Tiv!”

👩

Abbildung 12.7: Hauspreis stratifizieren

Quellcode

12.4 Kontrollieren von Variablen

💡 Durch das Aufnehmen von Prädiktoren in die multiple Regression werden die Prädiktoren kontrolliert (adjustiert, konditioniert):

Die Koeffizienten einer multiplen Regression zeigen den Zusammenhang \(\beta\) des einen Prädiktors mit \(y\), wenn man den (oder die) anderen Prädiktoren statistisch konstant hält.

Man nennt die Koeffizienten einer multiplen Regression daher auch parzielle Regressionskoeffizienten. Manchmal spricht man, eher umgangssprachlich, auch vom “Netto-Effekt” eines Prädiktors, oder davon, dass ein Prädiktor “bereinigt” wurde vom (linearen) Einfluss der anderen Prädiktoren auf \(y\).

Damit kann man die Regressionskoeffizienten so interpretieren, dass Sie den Effekt des Prädiktors \(x_1\) auf \(y\) anzeigen unabhängig vom Effekt der anderen Prädiktoren, \(x_2,x_3,...\) auf \(y\).

Man kann sich dieses Konstanthalten vorstellen als eine Aufteilung in Gruppen: Der Effekt eines Prädiktors \(x_1\) wird für jede Ausprägung (Gruppe) des Prädiktors \(x_2\) berechnet.

12.4.1 Das Hinzufügen von Prädiktoren kann die Gewichte der übrigen Prädiktoren ändern

Aber welche und wie viele Prädiktoren soll ich denn jetzt in mein Modell aufnehmen?! Und welches Modell ist jetzt richtig?!

🧑

Leider kann die Statistik keine Antwort darauf geben.

👩

Wozu ist sie dann gut?!

🧑

Wichtig

In Beobachtungsstudien hilft nur ein (korrektes) Kausalmodell. Ohne Kausalmodell ist es nutzlos, die Regressionskoeffizienten (oder eine andere Statistik) zur Erklärung der Ursachen heranzuziehen: Die Regressionskoeffizienten können sich wild ändern, wenn man Prädiktoren hinzufügt oder weglässt. Es können sich sogar die Vorzeichen der Regressionsgewichte ändern; in dem Fall spricht man von einem Simpson-Paradox.

12.5 Welches Modell richtig ist, kann die Statistik nicht sagen

Often people want statistical modeling to do things that statical modeling cannot do. For example, we’d like to know wheter an effect is “real” or rather spurios. Unfortunately, modeling merely quantifies uncertainty in the precise way that the model understands the problem. Usually answers to lage world questions about truth and causation depend upon information not included in the model. For example, any observed correlation between an outcome and predictor could be eliminated or reversed once another predictor is added to the model. But if we cannot think of the right variable, we might never notice. Therefore all statical models are vulnerable to and demand critique, regardless of the precision of their estimates and apparaent accuracy of their predictions. Rounds of model criticism and revision embody the real tests of scientific hypotheses. A true hypothesis will pass and fail many statistical “tests” on its way to acceptance.

McElreath (2020), S. 139

12.5.1 Kausalmodell für Konfundierung, km1

Das Kausalmodell km1 ist in Abbildung 12.8 dargestellt; vgl. Abbildung 12.7.

Abbildung 12.8: Kausalmodell km1 - Eine Erklärung (von mehreren) für m1 bzw. die Daten, die m1 zugrunde liegen

Wenn dieses Kausalmodell stimmt, findet man eine Scheinkorrelation zwischen price und bedrooms.

Eine Scheinkorrelation ist ein Zusammenhang, der nicht auf eine kausalen Einfluss beruht.

d_connected heißt, dass die betreffenden Variablen “verbunden” sind durch einen gerichteten (d wie directed) Pfad, durch den die Assoziation (Korrelation) wie durch einen Fluss fließt 🌊. d_separated heißt, dass sie nicht d_connected sind.

12.5.2 m2 kontrolliert die Konfundierungsvariable livingArea

Wenn das Kausalmodell stimmt, dann zeigt m2 den kausalen Effekt von livingArea.

Was tun wir jetzt bloß?! Oh jeh!

🧑

Wir müssen die Konfundierungsvariable kontrollieren.

👩

Abbildung 12.9 zeigt, dass bedrooms und price unkorreliert werden (d_separated), wenn man living area kontrolliert.

Abbildung 12.9: Durch Kontrolle von living area wird die Assoziation von price und bedrooms aufgehoben.

Durch das Kontrollieren (“adjustieren”), sind bedrooms und price nicht mehr korreliert, nicht mehr d_connected, sondern jetzt d_separeted.

12.5.3 Konfundierer kontrollieren

Gehen wir in diesem Abschnitt davon aus, dass km1 richtig ist.

Ohne Kontrollieren der Konfundierungsvariablen: Regressionsmodell y ~ x, Abbildung 12.10, links: Es wird (fälschlich) eine Korrelation zwischen x und y angezeigt: Scheinkorrelation. Mit Kontrollieren der Konfundierungsvariablen: Regressionsmodell y ~ x + group, Abbildung 12.10, rechts.

(a) Ohne Kontrolle der Konfundierungsvariablen: Konfundierung tritt auf.

(b) Mit Kontrolle der Konfundierungsvariablen: Konfundierung tritt nicht auf.

Abbildung 12.10: Konfundierung von y und x!

Abbildung 12.10, rechts, zeigt korrekt, dass es keine Korrelation zwischen x und y gibt, wenn group kontrolliert wird. Außerdem sieht man im rechten Teildiagramm, dass es ein Kontrollieren der Variable group durch Aufnahme als Prädiktor in die Regressionsgleichung einem Stratifizieren entspricht (getrennte Berechnung der Regressionsgerade pro Gruppe).

Quellcode

12.5.4 m1 und m2 passen nicht zu den Daten, wenn km1 stimmt

Laut km1 dürfte es keine Assoziation (Korrelation) zwischen bedrooms und price geben, wenn man livingArea kontrolliert, wie in Abbildung 12.8 dargestellt. Es gibt aber noch eine Assoziation zwischen bedrooms und price geben, wenn man livingArea kontrolliert. Daher sind sowohl m1 und m2 nicht mit dem Kausalmodell km1 vereinbar.

12.5.5 Kausalmodell 2, km2

Unser Modell m2 sagt uns, dass beide Prädiktoren jeweils einen eigenen Beitrag zur Erklärung der AV haben.

Daher könnte das folgende Kausalmodell, km2 besser passen.

In diesem Modell gibt es eine Wirkkette: \(a \rightarrow b \rightarrow p\).

Insgesamt gibt es zwei Kausaleinflüsse von a auf p: - \(a \rightarrow p\) - \(a \rightarrow b \rightarrow p\)

Man nennt die mittlere Variable einer Wirkkette auch einen Mediator und den Pfad von der UV (a) über den Mediator (b) zur AV (p) auch Mediation, s. Abbildung 12.11.

Abbildung 12.11: Der Effekt von livingArea wird über den Mediator bedrooms auf price vermittelt.

12.5.6 Dons Kausalmodell, km3

So sieht Dons Kausalmodell aus, s. Abbildung 12.12.

Abbildung 12.12: Dons Kausalmodell

“Ich glaube aber an mein Kausalmodell. Mein Kausalmodell ist das größte! Alle anderen Kausalmodelle sind ein Disaster!”

🧑

“Don, nach deinem Kausalmodell müssten bedrooms und livingArea unkorreliert sein. Sind sie aber nicht.”

🧑

Rechne doch selber die Korrelation aus, Don:

“Äh, wie ging das nochmal?”

🧑

So könntest du das rechnen, Don: correlation(d, select = c("bedrooms", "livingArea")). Oder z.B. so:

dons_r <- d %>% 
  summarise(cor(bedrooms, livingArea))

Die Korrelation liegt also bei 0.66

“Bitte, gerne hab ich dir geholfen, Don.”

👩

12.5.7 Unabhängigkeiten laut der Kausalmodelle

km1: b: bedrooms, p: price, a area (living area), s. Abbildung 12.8.

Das Kausalmodell km1 behauptet: \(b \perp \!\!\! \perp p \, |\, a\): bedrooms sind unabhängig von price, wenn man livingArea kontrolliert.

Kontrollieren einer Variable \(Z\) erreicht man auf einfache Art, indem man sie in zusätzlich zur vermuteten Ursache \(X\) in die Regressionsgleichung mit aufnimmt, also y ~ x + z.

Aber diese behauptete Unabhängigkeit findet sich nicht in den Daten wieder, s. Tabelle 12.8. Also: ⛈️ Passt nicht zu den Daten!

km2 b: bedrooms, p: price, a area (living area), s. Abbildung 12.11.

Das Kausalmodell km2 postuliert keine Unabhängigkeiten: Laut km2sind alle Variablen des Modells miteinander assoziiert (korreliert).

Hinweis

Ein Modell, in dem alle Variablen miteinander korreliert sind, nennt man auch satuiert oder saturiertes Modell. So ein Modell ist empirisch schwach. Denn: Behauptet ein Modell, dass die Korrelation zwischen zwei Variablen irgendeinen Wert zwischen -1 und +1 beträgt (nur nicht exakt Null), so ist das eine sehr schwache Aussage (und kaum zu falsifizieren). So ein Modell ist wissenschaftlich wenig wert. Das ist so ähnlich wie ein Modell, das voraussagt, dass es morgen irgendeine Temperatur hat zwischen -30 und +30 Grad (nur nicht exakt Null). Trifft diese Temperaturvorhersage ein, so werden wir nicht gerade beeindruckt sein. 🥱

Fazit: km2 passt zu den Daten, aber wir sind nicht gerade beeindruckt vom Modell.

km3: b: bedrooms, p: price, a area (living area), s. Abbildung 12.12.

\(b \perp \!\!\! \perp a\): bedrooms sind unabhängig von livingArea (a)

⛈️ km3 passt nicht zu den Daten/zum Modell!

12.6 DAGs: Directed Acyclic Graphs

Was sind DAGs? Wir haben in diesem Kapitel schon viele Beispiele gesehen, z.B. Abbildung 12.12.

  • DAGs sind eine bestimmte Art von Graphen zur Analyse von Kausalstrukturen.

  • Ein Graph besteht aus Knoten (Variablen) und Kanten (Linien), die die Knoten verbinden.

  • DAGs sind gerichtet; die Pfeile zeigen immer in eine Richtung (und zwar von Ursache zu Wirkung).

  • DAGs sind azyklisch; die Wirkung eines Knoten darf nicht wieder auf ihn zurückführen.

  • Ein Pfad ist ein Weg durch den DAG, von Knoten zu Knoten über die Kanten, unabhängig von der Pfeilrichtung.

Der DAG von km1 ist in Abbildung 12.8 zu sehen.

12.6.1 Leider passen potenziell viele DAGs zu einer Datenlage

b: bedrooms, p: price, a area (living area)

Ja, der Job der Wissenschaft ist kein Zuckerschlecken. Aber wenn es einfach wäre, die Kausalstruktur der Phänomene zu entdecken, wären sie längst erkannt, und alle Probleme der Menschheit gelöst.

In Abbildung 12.13 sind mögliche Kausalmodelle für Dons Studie dargestellt.

Abbildung 12.13: Kausalmodelle, die potenziell geeignet sind für Dons Fragestellung

Alle diese DAgs in Abbildung 12.8 haben die gleichen Implikationen hinsichtlich der (Un-)Abhängigkeiten zwischen der Variablen. Wir können also leider empirisch nicht bestimmen, welcher der DAGs der richtige ist. Um den richtigen DAG zu identifizieren, bräuchten wir z.B. einen reichhaltigeren DAG, also mit mehr Variablen.

12.6.2 Was ist eigentlich eine Ursache?

Etwas verursachen kann man auch (hochtrabend) als “Kausation” bezeichnen.

Hinweis

Weiß man, was die Wirkung \(W\) einer Handlung \(H\) (Intervention) ist, so hat man \(H\) als Ursache von \(W\) erkannt.

McElreath (2020)

Viele Menschen denken - fälschlich - dass Korrelation Kausation bedeuten muss, s. Abbildung 12.14.

Abbildung 12.14: xkcd zum Thema Kausation

Quelle und Erklärung

12.6.3 Zwischenfazit

Sind zwei Variablen korreliert (abhängig, assoziiert), so kann es dafür zwei Gründe geben:

  • Kausaler Zusammenhang
  • Nichtkausaler Zusammenhang (“Scheinkorrelation”)

Eine mögliche Ursache einer Scheinkorrelation ist Konfundierung.

Konfundierung kann man entdecken, indem man die angenommene Konfundierungsvariable kontrolliert (adjustiert), z.B. indem man ihn als Prädiktor in eine Regression aufnimmt.

Ist die Annahme einer Konfundierung korrekt, so löst sich der Scheinzusammenhang nach dem Adjustieren auf.

Löst sich der Scheinzusammenhang nicht auf, sondern drehen sich die Vorzeichen der Zusammenhänge nach Adjustieren um, so spricht man einem Simpson-Paradox.

Die Daten alleine können nie sagen, welches Kausalmodell der Fall ist in einer Beobachtungsstudie. Fachwissen (inhaltliches wissenschaftliches Wissen) ist nötig, um DAGs auszuschließen.

12.6.4 Schoki macht Nobelpreis! (?)

🏎️ Vertiefung 🏎️

Eine Studie fand eine starke Korrelation, \(r=0.79\) zwischen (Höhe des) Schokoladenkonsums eines Landes und (Anzahl der) Nobelpreise eines Landes (Messerli 2012), s. Abbildung 12.15.

Abbildung 12.15: Je mehr Schoki, desto mehr Nobelpreise
Wichtig

Korrelation ungleich Kausation! Korrelation kann bedeuten, dass eine Kausation vorliegt, aber es muss auch nicht sein, dass Kausation vorliegt. Liegt Korrelation ohne Kausation vor, so spricht man von einer Scheinkorrelation. Um Scheinkorrelation von echter Assoziation (auf Basis von Kausation) abzugrenzen, muss man die Kausalmodelle überprüfen, so wie wir das hier tun.

Der “Schoki-DAG” in Abbildung 12.16 zeigt den DAG für das Schokoloaden-Nobelpreis-Modell.

Abbildung 12.16: Macht Schokolade Nobelpreise?

12.7 Kollision

12.7.1 Kein Zusammenhang von Intelligenz und Schönheit (?)

Gott ist gerecht (?)

Zumindest findet sich in folgenden Daten kein Zusammenhang von Intelligenz (talent) und Schönheit (looks), wie Abbildung 12.17 illustriert. Für geringe Intelligenzwerte gibt es eine breites Spektrum von Schönheitswerten und für hohe Intelligenzwerte sieht es genauso aus.

Abbildung 12.17: Kein Zusammenhang von Intelligenz und Schönheit in den Daten

Gott ist gerecht (?)

12.7.2 Aber Ihre Dates sind entweder schlau oder schön

Seltsamerweise beobachten Sie, dass die Menschen, die Sie daten (Ihre Dates), entweder schön sind oder schlau - aber seltens beides gleichzeitig (schade), s. Abbildung 12.18.

Abbildung 12.18: Ihre Datingpartner sind komischerweise entweder schlau oder schön (aber nicht beides), zumindest in der Tendenz.

Wie kann das sein?

12.8 DAG zur Rettung

🦹 🦸

Der DAG in Abbildung 12.19 bietet eine rettende Erklärung.

Abbildung 12.19: Date als gemeinsame Wirkung von Schönheit und Intelligenz. Stratifiziert man die gemeinsame Wirkung (dates), so kommt es zu einer Scheinkorrelation zwischen Schönheit und Intelligenz.

Eine ähnliche Visualisierung des gleichen Sachverhalts zeigt Abbildung 12.20.

Abbildung 12.20: Durch Kontrolle der gemeinsamen Wirkung entsteht eine Scheinkorrelation zwischen den Ursachen

12.8.1 Was ist eine Kollision?

Als Kollision (Kollisionsverzerrung, Auswahlverzerrung, engl. collider) bezeichnet man einen DAG, bei dem eine Wirkung zwei Ursachen hat (eine gemeinsame Wirkung zweier Ursachen). Kontrolliert man die Wirkung m, so entsteht eine Scheinkorrelation zwischen den Ursachen x und y. Kontrolliert man die Wirkung nicht, so entsteht keine Scheinkorrelation zwischen den Ursachen, s. Abbildung 12.19, vgl. Rohrer (2018).

Wichtig

Man kann also zu viele oder falsche Prädiktoren einer Regression hinzufügen, so dass die Koeffizienten nicht die kausalen Effekte zeigen, sondern durch Scheinkorrelation verzerrte Werte.

12.8.2 Einfaches Beispiel zur Kollision

In der Zeitung Glitzer werden nur folgende Menschen gezeigt:

  • Schöne Menschen
  • Reiche Menschen

Sehen wir davon aus, dass Schönheit und Reichtum unabhängig voneinander sind.

Wenn ich Ihnen sage, dass Don nicht schön ist, aber in der Glitzer häufig auftaucht, was lernen wir dann über seine finanzielle Situation?4

“Ich bin schön, unglaublich schön, und groß, großartig, tolle Gene!!!” 🧑

12.8.3 Noch ein einfaches Beispiel zur Kollision

“So langsam check ich’s!” 🧑

Sei Z = X + Y, wobei X und Y unabhängig sind.

Wenn ich Ihnen sage, X = 3, lernen Sie nichts über Y, da die beiden Variablen unabhängig sind Aber: Wenn ich Ihnen zuerst sage, Z = 10, und dann sage, X = 3, wissen Sie sofort, was Y ist (Y = 7).

Also: X und Y sind abhängig, gegeben Z: \(X \not\perp \!\!\! \perp Y \,|\, Z\).5

12.8.4 Durch Kontrollieren entsteht eine Verzerrung bei der Kollision

Abbildung 12.19 zeigt: Durch Kontrollieren entsteht eine Kollision, eine Scheinkorrelation zwischen den Ursachen.

Kontrollieren kann z.B. bedeuten:

  • Stratifizieren: Aufteilen von date in zwei Gruppen und dann Analyse des Zusammenhangs von talent und looks in jeder Teilgruppe von date
  • Kontrollieren mit Regression: Durch Aufnahme von date als Prädiktor in eine Regression zusätzlich zu looks mit talent als Prädikotr

Ohne Kontrolle von date entsteht keine Scheinkorrelation zwischen Looks und Talent. Der Pfad (“Fluss”) von Looks über date nach Talent ist blockiert.

Kontrolliert man date, so öffnet sich der Pfad Looks -> date -> talent und die Scheinkorrelation entsteht: Der Pfad ist nicht mehr “blockiert”, die Korrelation kann “fließen” - was sie hier nicht soll, denn es handelt sich um Scheinkorrelation.

Das Kontrollieren von date geht zumeist durch Bilden einer Auswahl einer Teilgruppe von sich.

12.8.5 IQ, Fleiss und Eignung fürs Studium

Sagen wir, über die Eignung für ein Studium würden nur (die individuellen Ausprägungen) von Intelligenz (IQ) und Fleiss entscheiden, s. den DAG in Abbildung 12.21.

Abbildung 12.21: Kollisionsstruktur im Dag zur Studiumseignung

Bei positiver eignung wird ein Studium aufgenommen (studium = 1) ansonsten nicht (studium = 0).

Quelle

eignung (fürs Studium) sei definiert als die Summe von iq und fleiss, plus etwas Glück:

set.seed(42)  # Reproduzierbarkeit
N <- 1e03  

d_eignung <-
tibble(
  iq = rnorm(N),  # normalverteilt mit MW=0, sd=1
  fleiss = rnorm(N),
  glueck = rnorm(N, mean = 0, sd = .1),
  eignung = 1/2 * iq + 1/2 * fleiss + glueck,
  # nur wer geeignet ist, studiert (in unserem Modell):
  studium = ifelse(eignung > 0, 1, 0) 
  )

Laut unserem Modell setzt sich Eignung zur Hälfte aus Intelligenz und zur Hälfte aus Fleiss zusammen, plus etwas Glück.

12.8.6 Schlagzeile “Schlauheit macht Studentis faul!”

Eine Studie untersucht den Zusammenhang von Intelligenz (iq) und Fleiß (f) bei Studentis (s). Ergebnis: Ein negativer Zusammenhang!?

Berechnen wir das “Eignungsmodell”, aber nur mit Studis (studium == 1, also ohne Nicht-Studis), s. Tabelle 12.12.

m_eignung <-
  stan_glm(iq ~ fleiss, data = d_eignung %>%  filter(studium == 1), refresh = 0)

hdi(m_eignung)
Tabelle 12.12: Zum Zusammenhang von Fleiss und Talent
Parameter 95% HDI
(Intercept) [ 0.70, 0.86]
fleiss [-0.53, -0.36]

Abbildung 12.22 zeigt das Modell und die Daten.

Abbildung 12.22: Der Zusammenhang von Fleiss und IQ

IQ ist nicht unabhängig von Fleiß in unseren Daten, sondern abhängig.

Nichtwissenschaftliche Berichte, etwa in einigen Medien, greifen gerne Befunde über Zusammenhänge auf und interpretieren die Zusammenhänge – oft vorschnell – als kausal.6

12.8.7 Kollisionsverzerrung nur bei Stratifizierung

Nur durch das Stratifizieren (Aufteilen in Subgruppen, Kontrollieren, Adjustieren) tritt die Scheinkorrelation auf, s. Abbildung 12.23.

Hinweis

Ohne Stratifizierung tritt keine Scheinkorrelation auf. Mit Stratifizierung tritt Scheinkorrelation auf.

Abbildung 12.23: Stratifizierung und Scheinkorrelation

Wildes Kontrollieren einer Variablen - Aufnehmen in die Regression - kann genausog ut schaden wie nützen.

Nur Kenntnis des DAGs verrät die richtige Entscheidung: ob man eine Variable kontrolliert oder nicht.

Hinweis

Nimmt man eine Variable als zweiten Prädiktor auf, so “kontrolliert” man diese Variable. Das Regressiongewicht des ersten Prädiktors wird “bereinigt” um den Einfluss des zweiten Prädiktors; insofern ist der zweite Prädiktor dann “kontrolliert”.

12.8.8 Einfluss von Großeltern und Eltern auf Kinder

Wir wollen hier den (kausalen) Einfluss der Eltern E und Großeltern G auf den Bildungserfolg der Kinder K untersuchen.

Wir nehmen folgende Effekte an:

  • indirekter Effekt von G auf K: \(G \rightarrow E \rightarrow K\)
  • direkter Effekt von E auf K: \(E \rightarrow K\)
  • direkter Effekt von G auf K: \(G \rightarrow K\)

Wir sind v.a. interessiert an \(G \rightarrow K\), dem direkten kausalen Effekt von Großeltern auf ihre Enkel, s. Abbildung 12.24, \(G \rightarrow K\).

Abbildung 12.24: Der kausale Effekt von Großeltern auf Enkel. Ein verlorener Fall, zumindest was den DAG betrifft

Aber was ist, wenn wir vielleicht eine unbekannte Variable übersehen haben? (S. nächster Abschnitt). 👻

12.8.9 Der Gespenster-DAG

👻

Es gibt “unheilbare” DAGs, nennen wir sie “Gespenster-DAGs”, in denen es nicht möglich ist, einen (unverzerrten) Kausaleffekt zu bestimmen, s. Abbildung 12.25. Letztlich sagt uns der DAG bzw. unsere Analyse zum DAG: “Deine Theorie ist nicht gut, zurück an den Schreibtisch und denk noch mal gut nach. Oder sammele mehr Daten.”

Abbildung 12.25: Der Gespenster-DAG: Eine Identifikation der Kausaleffekt ist nicht (vollständig) möglich.
  • U könnte ein ungemessener Einfluss sein, der auf E und K wirkt, etwa Nachbarschaft.

  • Die Großeltern wohnen woanders (in Spanien), daher wirkt die Nachbarschaft der Eltern und Kinder nicht auf sie.

  • E ist sowohl für G als auch für U eine Wirkung, also eine Kollisionsvariable auf diesem Pfad.

  • Wenn wir E kontrollieren, wird es den Pfad \(G \rightarrow K\) verzerren, auch wenn wir niemals U messen.

Die Sache ist in diesem Fall chancenlos. Wir müssen diesen DAG verloren geben, McElreath (2020), S. 180.

12.9 Die Hintertür schließen

12.9.1 Zur Erinnerung: Konfundierung

Forschungsfrage: Wie groß ist der (kausale) Einfluss der Schlafzimmerzahl auf den Verkaufspreis des Hauses?

a: livingArea, b: bedrooms, p: prize

UV: b, AV: p

Das Kausalmodell ist in Abbildung 12.26 dargestellt.

Abbildung 12.26: Der Preis wird sowohl von der Zimmerzahl als auch der Wohnfläche beeinflusst

Im Regressionsmodell p ~ b wird der kausale Effekt verzerrt sein durch die Konfundierung mit a. Der Grund für die Konfundierung sind die zwei Pfade zwischen b und p:

  1. \(b \rightarrow p\)
  2. \(b \rightarrow a \rightarrow p\)

Beide Pfade erzeugen (statistische) Assoziation zwischen b und p. Aber nur der erste Pfad ist kausal; der zweite ist nichtkausal. Gäbe es nur nur den zweiten Pfad und wir würden b ändern, so würde sich p nicht ändern.

12.9.2 Gute Experimente zeigen den echten kausalen Effekt

Abbildung 12.27 zeigt eine erfreuliche Situation: Die “Hintertür” zu unserer UV (Zimmerzahl) ist geschlossen!

Ist die Hintertür geschlossen - führen also keine Pfeile in unserer UV - so kann eine Konfundierung ausgeschlossen werden.

Abbildung 12.27: Unverzerrte Schätzung des kausalen Effekts unserer UV (Zimmerzahl). Das Regressionsgewicht ist hier der unverzerrte Kausaleffekt. Es spielt keine Rolle, ob der andere Prädiktor im Modell enthalten ist. Da die beiden Prädiktoren unkorreliert sind, hat die Aufnahme des einen Prädiktors keinen Einfluss auf das Regressionsgewicht des anderen.

Die “Hintertür” der UV (b) ist jetzt zu! Der einzig verbleibende, erste Pfad ist der kausale Pfad und die Assoziation zwischen b und p ist jetzt komplett kausal.

Eine berühmte Lösung, den kausalen Pfad zu isolieren, ist ein (randomsiertes, kontrolliertes) Experiment. Wenn wir den Häusern zufällig (randomisiert) eine Anzahl von Schlafzimmern (b) zuweisen könnten (unabhängig von ihrer Quadratmeterzahl, a), würde sich der Graph so ändern. Das Experiment entfernt den Einfluss von a auf b. Wenn wir selber die Werte von b einstellen im Rahmen des Experiments, so kann a keine Wirkung auf b haben. Damit wird der zweite Pfad, \(b \rightarrow a \rightarrow p\) geschlossen (“blockiert”).

12.9.3 Hintertür schließen auch ohne Experimente

Konfundierende Pfade zu blockieren zwischen der UV und der AV nennt man auch die Hintertür schließen (backdoor criterion).

Wir wollen die Hintertüre schließen, da wir sonst nicht den wahren, kausalen Effekt bestimmen können.

Zum Glück gibt es neben Experimenten noch andere Wege, die Hintertür zu schließen, wie die Konfundierungsvariable a in eine Regression mit aufzunehmen.

Warum blockt das Kontrollieren von aden Pfad \(b \leftarrow a \rightarrow p\)? Stellen Sie sich den Pfad als eigenen Modell vor. Sobald Sie a kennen, bringt Ihnen Kenntnis über b kein zusätzliches Wissen über p. Wissen Sie hingegen nichts über a, lernen Sie bei Kenntnis von b auch etwas über p. Konditionieren ist wie “gegeben, dass Sie a schon kennen…”.

\(b \perp \!\!\! \perp p \,|\,a\)

12.9.4 Die vier Atome der Kausalanalyse

Abbildung 12.28 stellt die vier “Atome” der Kausalinferenz dar. Mehr gibt es nicht! Kennen Sie diese vier Grundbausteine, so können Sie jedes beliebige Kausalsystem (DAG) entschlüsseln.

Abbildung 12.28: Die vier Atome der Kausalinferenz

12.9.5 Mediation

Die Mediation (synonym: Wirkkette, Rohr, Kette, chain) beschreibt Pfade, in der die Kanten (eines Pfades) die gleiche Wirkrichtung haben: \(x \rightarrow m \rightarrow y\). Anders gesagt: Eine Mediation ist eine Kausalabfolge der Art \(x \rightarrow m \rightarrow y\), s. Abbildung 12.29. Die Variable in der Mitte \(m\) der Kette wird auch Mediator genannt, weil sei die Wirkung von X auf Y “vermittelt” oder überträgt. Die Erforschung von Mediation spielt eine recht wichtige Rolle in einigen Wissenschaften, wie der Psychologie.

Abbildung 12.29: Das Kausalmodell der Mediation.

Ohne Kontrollieren ist der Pfad offen: Die Assoziation “fließt” den Pfad entlang (in beide Richtungen). Kontrollieren blockt (schließt) die Kette (genau wie bei der Gabel).

Es kann auch angenommen werden, dass der Mediator nicht der einzige Weg von X zu Y ist, s. Abbildung 12.30. In Abbildung 12.30 gibt es zwei kausale Pfade von X zu Y: \(x\rightarrow m \rightarrow y\) und \(x \rightarrow y\). Die Summe der Effekte beider Pfade nennt man den totalen (kausalen) Effekt. Den Effekt über den Mediatorpfad nennt man den indirekten (kausalen) Effekt und den Pfad \(x\rightarrow y\) nennt man den direkten (kaudalen) Effekt.

Abbildung 12.30: Partielle Mediation

12.10 Der Nachfahre

Ein Nachfahre (descendent) ist eine Variable die von einer anderen Variable beeinflusst wird, s. Abbildung 12.31. Kontrolliert man einen Nachfahren d, so kontrolliert man damit zum Teil den Vorfahren (die Ursache), m. Der Grund ist, dass d Information beinhaltet über m. Hier wird das Kontrollieren von d den Pfad von x nach y teilweise öffnen, da m eine Kollisionsvariable ist.

Abbildung 12.31: Ein Nachfahre verhält sich ähnlich wie sein Vorfahre…

12.10.1 Kochrezept zur Analyse von DAGs

Wie kompliziert ein DAG auch aussehen mag, er ist immer aus diesen vier Atomen aufgebaut.

Hier ist ein Rezept, das garantiert, dass Sie welche Variablen Sie kontrollieren sollten und welche nicht:

  1. Listen Sie alle Pfade von UV (X) zu AV (Y) auf.
  2. Beurteilen Sie jeden Pfad, ob er gerade geschlossen oder geöffnet ist.
  3. Beurteilen Sie für jeden Pfad, ob er ein Hintertürpfad ist (Hintertürpfade haben einen Pfeil, der zur UV führt).
  4. Wenn es geöffnete Hinterpfade gibt, prüfen Sie, welche Variablen mann kontrollieren muss, um den Pfad zu schließen (falls möglich).

12.11 Schließen Sie die Hintertür (wenn möglich)!, bsp1

UV: \(X\), AV: \(Y\), drei Covariaten (A, B, C) und ein ungemessene Variable, U

Abbildung 12.32: Puh, ein schon recht komplizierter DAG

Es gibt zwei Hintertürpfade in Abbildung 12.32:

  1. \(X \leftarrow U \leftarrow A \rightarrow C \rightarrow Y\), offen
  2. \(X \leftarrow U \rightarrow B \leftarrow C \rightarrow Y\), geschlossen

Kontrollieren von \(A\) oder (auch) \(C\) schließt die offene Hintertür.

McElreath (2020), Kurz (2021), s.S. 186.

12.11.1 Schließen Sie die Hintertür (wenn möglich)!, bsp2

S. DAG in Abbildung 12.33: UV: \(W\), AV: \(D\)

Abbildung 12.33: Welche Variablen muss man kontrollieren, um den Effekt von W auf D zu bestimmen?

Kontrollieren Sie diese Variablen, um die offenen Hintertüren zu schließen:

  • entweder \(A\) und \(M\)
  • oder \(S\)

Mehr Infos

Details finden sich bei McElreath (2020) oder Kurz (2021), ‚S. 188.

12.11.2 Implizierte bedingte Unabhängigkeiten von bsp2

Ein Graph ohne Us ist eine starke - oft zu starke (unrealistisch optimistische) - Annahme. Auch wenn die Daten nicht sagen können, welcher DAG der richtige ist, können wir zumindest lernen, welcher DAG falsch ist. Die vom Modell implizierten bedingten Unabhängigkeiten geben uns Möglichkeiten, zu prüfen, ob wir einen DAG verwerfen (ausschließen) können. Bedingten Unabhängigkeit zwischen zwei Variablen sind Variablen, die nicht assoziiert (also stochastisch unabhängig) sind, wenn wir eine bestimmte Menge an Drittvariablen kontrollieren.

bsp2 impliziert folgende bedingte Unabhängigkeiten:

## A _||_ W | S
## D _||_ S | A, M, W
## M _||_ W | S

12.12 Fazit

Wie (und sogar ob) Sie statistische Ergebnisse (z.B. eines Regressionsmodells) interpretieren können, hängt von der epistemologischen Zielrichtung der Forschungsfrage ab:

  • Bei deskriptiven Forschungsfragen können die Ergebnisse (z.B. Regressionskoeffizienten) direkt interpretiert werden. Z.B. “Der Unterschied zwischen beiden Gruppen beträgt etwa …”. Allerdings ist eine kausale Interpretation nicht zulässig.
  • Bei prognostischen Fragestellungen (Vorhersagen) spielen die Modellkoeffizienten keine Rolle, stattdessen geht es um vorhergesagten Werte, \(\hat{y}_i\), z.B. auf Basis der PPV. Kausalaussagen sind zwar nicht möglich, aber auch nicht von Interesse.
  • Bei kausalen Forschungsfragen dürfen die Modellkoeffizienten nur auf Basis eines Kausalmodells (DAG) oder eines (gut gemachten) Experiments interpretiert werden.

Modellkoeffizienten ändern sich (oft), wenn man Prädiktoren zum Modell hinzufügt oder wegnimmt. Entgegen der verbreiteten Annahme ist es falsch, möglichst viele Prädiktoren in das Modell aufzunehmen, wenn das Ziel eine Kausalaussage ist. Kenntnis der “kausalen Atome” ist Voraussetzung zur Ableitung von Kausalschlüsse in Beobachtungsstudien.

12.13 Aufgaben

12.14


  1. Dieser Abschnitt ist prüfungsrelevant, birgt aber nichts Neues.↩︎

  2. In aller Regel macht es mehr Sinn, die Schätzbereiche der Punktschätzer auch zu betrachten. Nur die Punktschätzer zu betrachten vernachlässigt wesentliche Information.↩︎

  3. Anstelle von estimate_relation() kann man auch (einfacher vielleicht) predict() verwenden: predict(m1, newdata = dons_new_house). Allerdings gibt predict() nur den vorhergesagten Wert aus. estimate_prediction() gibt noch zusätzlich das Vorhersageintervall aus, berücksichtigt also die (doppelte) Ungewissheit der Vorhersage. Mit anderen Worten: estimate_prediction gibt die PPV aus.↩︎

  4. Don muss reich sein.↩︎

  5. Der horizontale Balken “|” bedeutet “gegeben, dass”. Ein Beispiel lautet \(Pr(A|B)\): “Die Wahrscheinlichkeit von A, gegeben dass B der Fall ist.↩︎

  6. Ehrlicherweise muss man zugeben, dass auch wissenschaftliche Berichte Daten über Zusammenhänge gerne kausal interpretieren, oft vorschnell.↩︎