Unsere Umfragen bauen wir in drei Schritten aus.
Stufe 1: Umfrageschnitt pur
In der Grafik auf der Titelseite zeigen wir unter „Umfrageschnitt pur“ das arithmetische Mittel aller Umfragen der wichtigsten Institute. Wir geben diese Zahlen 1:1 ungewichtet wieder, heißt also: pro Woche haben wir alle Umfragen zusammengerechnet und den Durchschnitt gebildet.
Berücksichtigt werden Umfragen von Allensbach, Emnid, Forsa, Forschungsgruppe Wahlen, GMS, Infratest dimap und INSA. Die Daten sind von wahlrecht.de.
Stufe 2: S&R-Umfrageschnitt
Diese zweite Stufe ist unsere Standardansicht. Hier zeigen wir einen gewichteten, tagesaktuellen, rollierenden Durchschnitt. Dazu berechnen wir ein gewichtetes arithmetisches Mittel der Umfragen der vorhergehenden 20 Tage.
Wir nutzen drei Gewichtungsfaktoren: Zeitpunkt der Befragung, Stichprobengröße und Abweichung der letzten Vorwahlbefragungen der Umfrageunternehmen vor den tatsächlichen Ergebnissen der letzten fünf Bundestagswahlen.
Das heißt: Neuere Umfragen und solche mit mehr Befragten fließen stärker in unseren Schnitt ein. Die Gewichtung auf Basis des letzten Tags der Befragung folgt einer logistischen Funktion: während Umfragen der ersten Woche noch stark einfließen, bekommen Umfragen der vorletzten Woche kaum noch Gewicht. Die Gewichtung auf Basis der Stichprobengröße erfolgt über Berechnung der sogenannten t-Statistik. Diese wird benötigt, um Konfidenzintervalle zu berechnen, welche die statistische Unsicherheit in Umfragewerten quantifizieren.
Für die Fehlerquote haben wir die mittlere quadratische Abweichung eines Instituts von den tatsächlichen Stimmanteilen der Parteien in den letzten fünf Bundestagswahlen berechnet. Heißt in der Praxis: Wenn ein Unternehmen in der Vergangenheit eine bestimmte Partei zu hoch oder zu niedrig eingeschätzt hat, dann geben wir den Umfragewerten dieses Unternehmens für diese Partei ein geringeres Gewicht. Oder andersherum: Wenn ein Unternehmen eine Partei in der Vergangenheit besonders treffsicher eingeschätzt hat, fließen die aktuellen Umfragewerte dieses Instituts zu dieser Partei stärker in unsere S&R-Umfrageschnitt-Werte ein.
Berücksichtigt werden auch hier Umfragen von Allensbach, Emnid, Forsa, Forschungsgruppe Wahlen, GMS, Infratest dimap, INSA. Die Daten sind von wahlrecht.de. Die Berechnungen und den Rechenweg mit Abweichungen aus der Vergangenheit werden im Magazin in Kürze noch näher beschreiben. Wer will, kann selbst mit den CSV-Dateien und dem Skript (in R) experimentieren. Sie sind hier auf Github hinterlegt. Bei Fragen, sind wir unter [email protected] zu erreichen.
Stufe 3: S&R-Prognose
Mit der dritten Ausbaustufe wagen wir uns am meisten aus der Deckung. Anders als die Momentaufnahmen in Schritt 1 und 2 blickt die Prognose in die Zukunft.
Mit unserer Vorhersage lehnen wir uns am weitesten aus dem Fenster und natürlich gibt es eine große Unsicherheit darüber, was bis zur Wahl die politische Debatte bestimmt. Irakkrieg, Oder-Hochwasser, Veggie-Debatte – all diese Faktoren waren seinerzeit Monate vor der Wahl kaum abzusehen. Erst langsam veränderten sich dann die Umfragewerte. Daten aus der Vergangenheit zeigen aber eine Alternative auf und wer eine Wahl vorhersagen will, die weiter in der Zukunft liegt, kann sich dem möglichen Ergebnis mit zusätzlichen Daten besser nähern: Den Ergebnissen bisheriger Bundestagswahlen und aktueller Landtagswahlen. Besonders weit vor einer Wahl ist ihre Prognosegenauigkeit höher als diejenige der wöchentlichen Sonntagsumfragen.
Zwei Bestandteile: Aktuelle Umfragen und Wahlergebnisse der letzten 20 Jahre
Für unsere S&R-Prognose kombinieren wir deshalb ein Modell auf Basis dieser Daten mit den Umfragen: Je weiter in der Zukunft die Wahl noch liegt, desto stärker werden die letzten tatsächlichen Ergebnisse gewichtet. Je näher die Bundestagswahl rückt, desto stärker fließen die Umfragen in unsere Prognose ein.
Pro Partei haben wir ermittelt, ob und wann Wahlen oder Umfragen besser als Indikator funktionieren und dann einen Zeitverlauf für unsere Gewichtung entwickelt: Sind die Wahlergebnisse zuverlässiger, werden sie länger stärker gewichtet, waren die Umfragen früh genau, werden sie früher stärker einbezogen.
Unsere Prognose wird sich dabei jeden Tag verändern, unabhängig davon, ob neue Umfragen erschienen sind, weil wir die Werte nicht nur auf Basis der Umfragen berechnen, sondern auch abhängig vom sinkenden Abstand zur Wahl. Noch mehr Details und Literatur zu unserem Modell gibt es in einem gesonderten Blogpost hier.
Warum wir so vorgehen
Noch einmal: Ob dieses Modell auch für die Wahl 2017 funktioniert, wissen wir erst am 24. September genau. In der Vergangenheit wäre mit dem Modell aber eine genauere Vorhersage möglich gewesen als auf Basis der Umfragen allein. Wir glauben, dass allein schon ein Mehrwert darin besteht, die Rechenwege und Überlegungen offen zu beschreiben und zu diskutieren. Wir wollen dieses Experiment mit Euch wagen und ein Ziel verfolgen: weniger schlechte Vorhersagen.
Übrigens:
Aktuell schauen wir auf knapp 3.000 Umfragen mit mehr als 20.000 Werten zu einzelnen Parteien. Die Befragungen werden seit Jahren hervorragend von wahlrecht.de aufbereitet, eine Wahnsinnsinitiative eines tollen Teams um Matthias Cantow. Herzlichen Dank!