27 sep. 2007

Vad menas med 'statistiskt säkerställd' egentligen? Jo....

Ofta när media presenterar resultat av opinionsundersökningar för partisympatier, skriver de om förändringar t ex "+ 0,3 procentenheter" eller "-0,7 procentenheter" med ett typiskt tillägg:

"Förändringarna ligger inom felmarginalen"eller
"Förändringen för parti X är inte statistiskt säkerställd"

Jaha? Hello there.......Vilken betydelse har detta i det stora sammanhanget?........
.
En statistisk säkerställning och en kanelbulle, tack...!..

Nu senast visar en undersökning att Kristdemokraterna kanske skulle hamna under riksdagens fyraprocentsspärr om det vore val idag: 3,9%

Jag ska försöka förklara 'statistiskt säkerställd' och 'inom felmarginalen' så att alla som läser detta begriper. Annars får ni klaga på mig. ;)

Jag pysslar ju trots allt med just statistik på dagarna.

Enkäter och opinionsrundringningar är exempel på så kallade stickprov. Inom stickproven arbetar man med förändringar.
När en förändring ligger inom felmarginalen, så ligger den inom ett s k konfidens-intervall (från latinets confidentia, tilltro). Konfidensintervallet anger graden av osäkerhet för ett mätvärde.

Varje konfidensintervall har en konfidens-GRAD, jag gissar på 95% i partisympati-fallet.

Detta betyder, i klarspråk, att: Det sannolika värdet ligger, med 95 procents säkerhet, inom konfidensintervallet. Inom felmarginalen, alltså.

Exempel: 25 +/- 3 (25 plus/minus 3) innebär:

....... att det riktiga värdet med 95 procents sannolikhet gömmer sig inom området 22-28. Någonstans däri befinner sig det vi letar efter. 24 hamnar inom felmarginalen, men inte t ex 29.

Så när det står:
"Förändringarna ligger inom felmarginalen", vad betyder det då, folks?
Jo, att den ökning eller minskning som anges, ligger inom det intervall där sanningen med 95% säkerhet, torde vara.


Hmmmm....fråga vid första anblick.....varför kan man inte använda ännu större säkerhet än 95%? T ex 97%? Eller, vänta...100% ?


Jo, därför att det blir omständigt. 100 procents säkerhet visar att man VET vari det rätta svaret ligger, i det här fallet riksdagsvalets utgång.......

....det gör man bara vart fjärde år......då man räknat precis alla rösterna.....

....men, men... 98 %-ig säkerhet, då? Fast då gissar undertecknad att man får fråga många, många fler än de 1000-2000 man brukar ringa runt till..... dyrt och omständigt, och kanske störande för vanligt folk som då skulle bli störda med telefonsamtal mit i maten nästan varenda dag...... ;)

Eh.......Fråga vid ANDRA anblick:
Ett ögonblick, hur VET man vilket som är felmarginalen? Och varför är man så säker (95%), på att "sanningen" ligger inom ett visst intervall?

Jo, man har baserat detta påstående på opinionsundersökningarna i historien och därav gjort en prognos med väntevärden, dvs de förväntade värdena på de olika parti-sympatierna, samt på förändringarna. (samt att man har formler för hur felmarginal beräknas men det kan jag ta upp en annan gång)

Det uppmätta resultatet t ex
Kd 3,9%,
ska ligga inom samma intervall som DET FÖRVÄNTADE VÄRDET.

.

Japp.

Några frågor?


Blog reactions to this post:
Dålig utveckling (Johan S)

.

17 kommentarer:

Hosanna sa...

Oh...tar mig för pannan och suckar lite. Siffror är definitivt inte min grej. Du kanske kan hjälpa mig att förklara hur man på bästa sätt överför små meningslösa statisktiska uppgifter till flaschiga OCH talande staplar i excel.

Z sa...

Hosanna
Excel? Jobbigt....
Ska tänka på det. jag är word-galen, jag vet, men jag brukar göra det snyggt i Word (enligt mig själv ;))

Johan Stenberg sa...

Z,
Byt genast till OpenOffice! :)

Om du nu sysslar med statistik dagarna i ända så kan du väl skriva en pedagogisk lärobok på svenska? Mina studenter klagar ständigt på att de inte begriper någonting av statistiken. Din pedagogiska nivå når helt andra höjder än min. :)

Z sa...

Johan
Ok, planerar att byta till Open, gillar allt som heter något med "Open Source"
Grattis till tusen till dina vetenskaps-publiceringar!

Snabbt pedagogiskt tips:
Gör som fysikern Cecilia Jarlskog:
Använd humor och grälla Aftonbladet-färger, samt ibland krigsrubriker.

Jag tänker hela tiden på hennes kvarkar nu.

Grue sa...

"Statistiskt säkerställd" är ett mått på när förändringen kan sägas vara "tillräckligt säker". Men när är den det? Det är helt godtyckligt.

Varje positiv förändring ökar förstås sannolikheten att partiet verkligen har gått upp i NÅGON mån. Så, begreppet statistisk säkerställt är rätt värdelöst egentligen. Det man kan ta med sig är att små förändringar har större sannolikhet att bero på mätfel än stora (men det är ju självklart egentligen).

Z sa...

Grue Välkommen hit

Javisst är det godtyckligt, det baseras på historiska resultat: erfarenhet.

Och valresultatet brukar avvika från opinionsundersökningar. Visst.

Till största del har du rätt,
små förändringar kan ofta bero på mätfel, men även jättestora förändringar kan bero på snedvriden utfrågning.
Felmarginalen har en gräns uppåt också.

Grue sa...

Oj sorry, jag missade din längre utläggning om begreppet. Trodde du faktiskt vill ha svar, men din fråga var ju retorisk! Tips: byt design så får man bättre överblick.

Bra genomgång av begreppet.

Vad tror du om dom som säger att Sd systematiskt underskattas i opinionsmätningar? Alla mätningar pekade på att Sd skulle få mindre än dom 2,93 % man fick i mätningen. Vet du hur mätningarna går till? Har hört att man blandar in gamla mätningar för att undvika variationer vilket kan leda till att man underskattar partier på uppgång.

Mvh/Grue

Z sa...

Grue
Jag frågade en gång om de slumpar postnummer, men de slumpar helt enkelt ut telefonnummer och ringer vid olika tider under dagen/kvällen.

De som oftast är hemma svarar och kvinnor är väl oftare hemma än män, aningens i alla fall, och bland dem är Sd-sympatierna lägre, verkar det som. Detta var ett vilt spånande, kan också bero på andra orsaker.

Röstar man på Sd kanske man känner sig orolig för att berätta detta, och väljer att hemlighålla det ända fram till valdagen...

Man kan jämföra med nu aktuella Sd-siffror, eller, de som kom månaden efter valet.

Äsch, det kan vara tusen orsaker. ;)

Charlotte Therese sa...

Z,

Ja, jag har en fråga... :-)

Hur "statistiskt säkerställt" tror du det är det att den där chokladkakan på översta bilden är lika smaskig i verkligheten som den ser ut?

Jag skulle nästan tippa på att vi där kan nå en 98%-ig nivå...

Slurp!

Charlotte

Charlotte Therese sa...

Du ser, t.o.m. orden hamnar huller om buller...

Elfte (blogg)budet är härmed instiftat:

"Du skall icke fresta dina bloggläsare med alltför munvattnande bilder...."

Charlotte

Z sa...

Charlotte
Men om man kollar bilderna på din konstlänk, verkar du vara en riktigt smal och smärt kvinna.

Visst, tårtan var lite pr för att läsarna skulle orka ge sig i kast med ett statistik-inlägg.....

Tippar med 95% säkerhet att den var smasken, ja :)

Charlotte Therese sa...

Z,

Ja, det stämmer - bränner energi betydligt snabbare än jag hinner fylla på.

Tror det beror på allt tänkande...

Så den dag jag slutar blogga hamnar jag nog i den "chokladiska riskzonen".

Men jag lyfte nu inte fram detta som en tungviktsfråga. Det var mer lättsamt menat... :-)

Charlotte

Hosanna sa...

Z; word går lika bra för jag är helt rudis, så vilket program jag sjabblar med gör detsamma. *s*

Dag Selander sa...

En statistisk säkerställning och en kanelbulle, tack...!
~~~~
Nåt för 2010 års projekt.

james bond sa...

jag har en fråga...

om intensiteten lamda e = 0,025 olyckor per dag....

va e då sannolikheten att 2 olyckor inträffar på tre dagar i följd!?

Z sa...

James Bond Välkommen!

P[(N(t + tau) - N(t) = k]=
= (e^-(lambda x tau) x (lambda x tau)^k)/(k!)

...menar du att det på tre dagar inträffar sammanlagt 6 olyckor?
I så fall:

Sannolikheten(N(t+3)-N(t)=6)=

=(e^(-0,025x3) x (0,025x3)^6)/(720)


^ betyder "upphöjt till"

Z sa...

....& så uträkningen:

0,9277x1,8x10^(-7)/720 = (om jag räknat rätt) 2,93x10^(¯10)

En extremt liten sannolikhet

eXTReMe Tracker