Da erstellen zwei Forscher eine “Notiz” mit dem schönen Titel “„Je höher die Impfquote, desto höher die Übersterblichkeit“, ein Mitglied der “Partei Bürger für Thüringen” (und vermutlich Coronaskeptikerin) macht sie publik und schon redet alle Welt davon.
Prompt kommen Faktenchecks, die allerdings wenig Details verraten oder die Ergebnisse nachvollziehen lassen. Also schnell selber die Daten runtergeladen und angeschaut. Eines vorweg, transparent in Datenquellen und Methodik ist die Originalnotiz, Bonuspunkte dafür (die statistischen Berechnungen stimmen auch). Auf der anderen Seite zeigt sich wie schnell mit dem Auswählen des richtigen Datensatzes und eines Meßwertes der für Ausreißer sehr anfällig ist, gezeigt werden kann, was gezeigt werden soll(?!). Der Kapitalfehler ist wohl sich auf lediglich einen 4 Wochenzeitraum zu beziehen und statistische Schlußfolgerungen ziehen zu wollen.
Anstatt einer (nach Bevölkerung gewichteten) Korrelation von +0.31, kommt bei mir dann eine (ungewichtete) Korrelation von -0.82 heraus. Was sind die Unterschiede zwischen den Analysen?
Ich habe als Basiswert für die Sterblichkeit die Jahre 2016-2019 herangezogen und nicht die Werte von 2016-2020 wie im Original (2020 war die Sterblichkeit schon coronabedingt höher, dieses Jahr mit in den Basisvergleichswert zu ziehen ist also nicht legitim). Ausserdem habe ich die gesamten ersten 43 Kalenderwochen von 2021 als aktuellen Vergleich anstatt nur der KW 36 bis KW 40 verwendet. Und auf einmal sieht die Korrelation im Scatterplot ganz anders aus. Was auf den ersten Blick auffällt, die westlichen Bundesländer sind schön linear angeordnet, während die östlichen wesentlich weiter gestreut sind und eine deutlich höhere Übersterblichkeit zeigen. So weit, so gut. Zu bemerken ist, dass das immer noch eine ziemlich krude und simplifizierende Analyse und Darstellung ist. Was fehlt?
- Die jeweiligen Impfquoten zu einem bestimmten Zeitpunkt sollten (um ein paar Wochen zeitversetzt) mit den Sterberaten korreliert werden, momentan sind nur die Impfquoten am 30.11.2021 in Betracht gezogen. (Die Impfquote im November 21 kann ja sicherlich keine Auswirkung auf die Sterbefälle im Januar 2021 haben).
- Die offiziellen Impfquoten sind nur als untere mögliche Grenze zu sehen, und könnten leicht um 5-10% höher liegen. Dabei ist möglich dass manche Bundesländer systematisch mehr unter-reporten als andere. Eine durch Datentriangulation verifizierte Impfquote wäre also eine weitere Verbesserung.
- Nicht nur die Impfquoten sondern auch die Inzidenzen sollten in einer gescheiten Analyse berücksichtigt werden, denn die Sterbefälle durch Corona richtet sich nach der Anzahl Infizierter, und nicht nach der Anzahl Geimpfter.
- Statistische Aussenseiter könnte man gesondern betrachten, wobei es in meiner Analyse kaum Ausreißer gibt.
- Weniger Marktschreierei wäre schön. Diese Analysen zeigen wie empfindlich die Statistiken auf einige wenige Datenpunkte mehr oder weniger reagieren können, und statistische Aussenseiter das beinflussen.
- “Correlation is not Causation”! Nur weil die US Ausgaben für science, space, and technology mit Selbstmorden durch Erhängen und Erdrosseln mit einem Wert von +0,99 korrelieren, verbieten wir nicht die Raumfahrt um Menschen vor dem Sich-erdrosseln zu schützen. Eine Korrelation muss keinesfalls kausale Zusammenhänge sichtbar machen!
- Eine Gewichtung nach Bevölkerungsgröße wäre machbar, aber mit der deutlichen klaren negativen Korrelation nicht wirklich eine sinnvolle Ergänzung.
- Thüringen sollte besonders aufpassen, es hat in 2021 bisher die zweithöchste Übersterblichkeit von allen Bundesländern, Frau Dr. Berger.
Meine Rohdaten und Analyseskripte sind hier zu finden. Ich bitte um Notiz wenn Sie darauf aufbauen oder etwas verfeinern.
Diese “quick and dirty” Analyse entstand in Vorbereitung eines Seminars zur kritischen Hinterfragung von wissenschaftlichen Studien, erhebt aber selber keinen Anspruch auf wissenschaftliche Gründlichkeit und Vollständigkeit. Geäußerte Meinungen sind meine persönlichen und repräsentieren weder die Haltung der Universität Hamburg noch der Professur für Digitale Märkte.
Originalnotiz: Steyer, Rolf, und Gregor Kappler. 16. November 2021. „Je höher die Impfquote, desto höher die Übersterblichkeit“.