Uppdaterad modell för pollofpolls.se

Pollofpolls.se har sedan ungefär en månad en ny och förbättrad modell för att väga samman opinionsundersökningar. Målsättningen med pollofpoll.se har varit att använda den bästa tillgängliga metoden för att väga samman opinionsundersökningar. Det har tidigare inte funnits någon bra publicerad metod för hur denna sammanvägning ska göras som är anpassad för flerpartisystem som vi har i Sverige. Därför har pollofpolls.se tidigare använt en modell basserad på modeller byggda för tvåpartisystem enligt amerikansk modell.

Men utvecklingen går framåt och numera finns det en publicerad modell som är specifikt framtagen för flerpartisystem. Modell är utvecklad av Jakob Bergman och Björn Holmquist [1] på statistiska institutionen vid Lunds Universitet och publicerad i Scandinavian Journal of Statistics. Bergman och Holmquist modell bygger, likt den som tidigare används för pollofpoll.se, på itererade lokalt viktade regressioner så kallade loess. Skillnaden mellan den nya modellen och den tidigare är att där den tidigare behandlade varje partis opinionsutveckling som en oberoende serie, hanterar den nya modellen serierna som beroende av varandra.

Lite enkelt kan skillnaden i modellerna förklaras på följande sätt. Det totala stödet för samtliga partier, inklusive gruppen övriga partier, måste alltid summeras till 100 %. Detta betyder att om exempelvis Moderaterna visar ett minskat väljarstöd så måste något eller några andra partier visa ett ökat väljarstöd. Den tidigare modellen tog inte hänsyn till detta utan räknade ut stödet för varje parti separat. Därför kunde modellen i princip visa ett tapp för Moderaterna utan att detta medförde en motsvarande ökning för andra partier. Summeringen av stödet för alla partier, inklusive gruppen övriga partier, kunde alltså vara så väl mer som mindre än 100 %. Numera skall summan av stödet för alla partier bli 100 % med en möjlig avvikelse på grund av avrundningsfel.

För den som är mer intresserad av den exakta matematiken bakom modellen så rekommenderar jag den här öppna versionen av Bergman och Holmquist artikel. Den publicerade versionen är också ett alternativ men kräver en prenumeration.

Det finns en viss skillnad mellan modellen som Bergman och Holmquist publicerat och den modell som implementerats för pollofpolls.se. Denna skillnad är i hur de enskilda opinionsmätningarna viktas jämtemot varandra. Bergman och Holmquist viktar enbart opinionsmätningarna med avseende på hur på mätdatum, där äldre mätningar ges en lägre vikt. Ingen viktning sker dock med avseende på exempelvis antalet tillfrågade, således ges en mätning av demoskop med 1250 tillfrågade samma vikt som en mätning av SCB med 6000 tillfrågade. För implementeringen av Bergman och Holmquist modell för pollofpolls.se viktas därför enskilda mätningar, förutom på tid även med hänsyn till antalet tillfrågade samt undersökningens längd.

Viktningen av antalet tillfrågade ökar med kvadratroten på antalet tillfrågade, en mätning behöver alltså fyra gånger så många tillfrågade för att få dubbelt så hög vikt. Motivet till detta är att standardavvikelsen för en mätning minskar approximativt med kvadratroten på antalet tillfrågade.

 

[1] Bergman, J. and Holmquist, B. (2013), Poll of Polls: A Compositional Loess Model. Scandinavian Journal of Statistics. doi: 10.1111/sjos.12023