Magazin

Die S&R-Prognose ist online! So funktioniert sie

Die dritte Stufe unseres Modells ist online und anders als die beiden bisherigen Schnitte wagt sie als Prognose den Blick in die Zukunft. Dafür kombinieren wir den S&R-Umfrageschnitt mit einem Prognosemodell, um täglich aktuelle Prognosen zu liefern. So funktioniert’s.

Vorab: Mit unserer Vorhersage lehnen wir uns am weitesten aus dem Fenster und natürlich gibt es eine große Unsicherheit darüber, was bis zur Wahl die politische Debatte bestimmt. Irakkrieg, Oder-Hochwasser, Veggie-Debatte – all diese Faktoren waren seinerzeit Monate vor der Wahl kaum abzusehen. Erst langsam veränderten sich dann die Umfragewerte.

Daten aus der Vergangenheit zeigen aber eine Alternative auf und wer eine Wahl vorhersagen will, die weiter in der Zukunft liegt, kann sich dem möglichen Ergebnis mit zusätzlichen Daten besser nähern: Den Ergebnissen bisheriger Bundestagswahlen und aktueller Landtagswahlen. Besonders weit vor einer Wahl ist ihre Prognosegenauigkeit höher als diejenige der wöchentlichen Sonntagsumfragen.

Zwei Bestandteile: Aktuelle Umfragen und Wahlergebnisse der letzten 20 Jahre

Für unsere S&R-Prognose kombinieren wir deshalb ein Modell auf Basis dieser Daten mit den Umfragen: Je weiter in der Zukunft die Wahl noch liegt, desto stärker werden die letzten tatsächlichen Ergebnisse gewichtet. Je näher die Bundestagswahl rückt, desto stärker fließen die Umfragen in unsere Prognose ein.

Pro Partei haben wir ermittelt, ob und wann Wahlen oder Umfragen besser als Indikator funktionieren und dann einen Zeitverlauf für unsere Gewichtung entwickelt: Sind die Wahlergebnisse zuverlässiger, werden sie länger stärker gewichtet, waren die Umfragen früh genau, werden sie früher stärker einbezogen.

Unsere Prognose wird sich dabei jeden Tag verändern, unabhängig davon, ob neue Umfragen erschienen sind, weil wir die Werte nicht nur auf Basis der Umfragen berechnen, sondern auch abhängig vom sinkenden Abstand zur Wahl.

Warum wir so vorgehen

Noch einmal: Ob dieses Modell auch für die Wahl 2017 funktioniert, wissen wir erst am 24. September genau. In der Vergangenheit wäre mit dem Modell aber eine genauere Vorhersage möglich gewesen, als auf Basis der Umfragen allein.

Hintergrund: Github-Code, Daten, Literatur, Formeln

Für genauere Details zur Berechnung gibt es hier die Daten und den Code und im Folgenden eine genauere Beschreibung der Methode, quasi das Kleingedruckte.

Die Prognose setzt sich zusammen aus dem Prognosemodell von Kayser & Leininger (2017) und dem S&R Schnitt. Ersteres wurde so angepasst, dass die AfD nicht mehr unter Sonstige firmiert, sondern eigene Datenpunkte darstellt.

Damit liefert das Modell zwar noch keine Vorhersagewerte für die AfD für 2017, aber Prognosewerte für die sogenannten Sonstigen, die die AfD ausschließen. Die Vorhersagen für die andere Parteien inklusive Sonstige summieren sich damit auf unter 100 Prozent. Die Differenz zu 100 Prozent ist die Prognose für die AfD.

Die Kombination der Prognose mit dem Umfrageschnitt ist angelehnt an Küntzler (2017). Die Gewichtung der beiden Komponenten erfolgt auf Basis der Varianz der Prognosen. Je präziser die Umfrage werden, desto mehr Gewicht erhalten sie. Die Präzision des Modells, als auch der Schnitte, basiert auf einem Vergleich der Vorhersage- bzw. Durchschnittswerte in den letzten 132 Tagen vor den letzten fünf Bundestagswahlen (1998-2013).

Berechnung

Für die etablierten Parteien betrachten wir den durchschnittlichen quadrierten Fehler auf Bundesebene für die letzten fünf Wahlen. Für die AfD, die 2013 erstmals antrat, den durchschnittlichen quadrierten Fehler über die 16 Länder 2013. Für den S&R-Schnitt betrachten wir die Abweichung zwischen Schnitt und tatsächlichem Ergebnis. Diese Abweichungen werden ebenfalls quadriert und dann der tagesspezifische Mittelwert für die Wahlen 1998 – 2013 berechnet. So haben wir für jeden der 132 Tage vor der Wahl ein Maß für die Ungenauigkeit des S&R Schnitts, wenn dieser als Prognose verstanden wird.

Die Prognose werden dann wie folgt zusammengesetzt:

V_p = e_s / (e_f + e_s) * F_p + e_f / (e_f + e_s) * S_p

V_p ist die Prognose für eine Partei p, e_f der durchschnittliche quadrierte Fehler des Forecasts, e_s der des Schnitts, S_p ist der aktuelle S&R Schnitt.

Damit ergibt sich die in den obigen Grafiken dargestellte Gewichtung von Prognose und Umfrage. Etwas unschön ist, dass für ein paar Parteien, die Umfragen schon 132 Tage vor der Wahl mehr Gewicht haben als der Forecast. Aber das ließ sich nicht ändern. Es gibt ein bis zwei Wahlen, bei denen das Modell für die SPD bzw. CDU/CSU um mehrere Prozentpunkte danebenliegt. Für die AfD hingegen ist die von Anfang hohe Gewichtung der Umfragen adäquat. In der Tendenz werden Umfragen über die Zeit wichtiger.

Literatur

Kayser, M.A., Leininger, A., 2017. A Länder-based Forecast of the 2017 German Bundestag Election. PS: Political Science & Politics 50, 689–692. doi:10.1017/S1049096517000427

Küntzler, T., 2017. Using Data Combination of Fundamental Variable-Based Forecasts and Poll-Based Forecasts to Predict the 2013 German Election. German Politics 0, 1–19. doi:10.1080/09644008.2017.1280781

(Foto von Roman Mager bei Unsplash)

Wissenschaftler sehen Schulz-Zug auf dem Abstellgleis

Nicht nur Meinungsumfragen versuchen den Ausgang der Bundestagswahl vorherzusagen. Auch Politikwissenschaftler arbeiten an Prognosemodellen. Über vier Monate vor der Wahl legen zwei davon sich fest: Merkel bleibt vorne.

Zum Artikel im Magazin

Woche 29 – Was die Umfragen zeigen

Zwei Monate vor der Wahl macht die AfD weiter leicht Boden gut und die SPD hat ihr Tief überwunden - sie muss aber noch schneller zulegen.

Zum Artikel im Magazin