00:00
00:00
KURSER  / 
Matematik 4
/  Trigonometri och trigonometriska funktioner

Felkällor och felmarginal

Författare:Simon Rybrand
Så hjälper Eddler dig:
Videor som är lätta att förstå Övningar & prov med förklaringar
Allt du behöver för att klara av nationella provet
Så hjälper Eddler dig:
Videor som är lätta att förstå Övningar & prov med förklaringar
Allt du behöver för att klara av nationella provet

När statistiska undersökningar görs så är det viktigt att förstå vilka felkällor som kan finnas. Dvs orsaker till att undersökningens resultat inte blir bra. Här lär du dig om dessa och vad felmarginal är.

Urvalsfel och svarsbortfall

Om man inte tar hänsyn till ovanstående när man gör urvalet riskerar man att det inte blir representativt . Då kan det bli ett skevt urval, ett urvalsfel, vilket kan leda till ett missvisande resultat.

Vid en undersökning måste man räkna med ett visst svarsbortfall. Det finns nämligen oftast ett antal efterfrågade svar som uteblir. Bortfall är alltid ett problem vid statistiska undersökningar. Det kan nämligen resultera i att urvalet inte längre är representativt för hela populationen. Därför är det viktigt att man har koll på bortfallet när man analyserar resultatet, eftersom ju större bortfall undersökningen har, desto mer osäkert kan studiens resultat vara.

För att skapa en större tillförlitlighet gör man därför bortfallsundersökningar och beräkningar av felmarginalen. Där efter räknar man om resultatet för att få en mer sanningsenlig bild av verkligheten.

Felkällor

Ju fler individer eller enheter som deltar i undersökningen, ju bättre resultat. Man måste alltså fråga tillräckligt många personer, för att få en så lite felmarginal som möjligt i en opinionsmätning. Frågar man få finns det en risk för att resultatet inte är representativa för hela populationen. Bäst vore givetvis att undersöka hela populationen, men det finns det oftast inte resurser till.

Några av de felkällor man bör tänka på vid analysen av undersökningen är svarsbortfallet, felaktigt i fyllda formulär, otydligt formulerade frågor och andra olika mätfel som bidrar till ett urvalsfel, alltså att undersöknings resultat i stickprovet inte motsvarar resultatet för hela populationen. 

Felmarginal

Med hjälp av följande formel försöker man säkerställa att en undersökning är tillförlitlig.

f=1,96f=1,96\cdotƒ =1,96·  p(100p)n\sqrt{\frac{p\left(100-p\right)}{n}}p(100p)n   där  nnn  är stickprovets storlek och  ppp  den procentuella andelen av populationen.

Felmarginalen  ffƒ  anges i procentenheter. Och man antar att det verkliga resultatet bör landa någonstans i intervallet resultatet plus minus felmarginalen. Alltså  ±f\pm f±ƒ  .

På grund av olika faktorer och slumpen händer det ändå att beräkningen av felmarginalen är fel. Men denna formel anses åtminstone ge korrekt svar i  959595 av 100100100 fall. Ett så kallat 95%95\%95% -igt konfidensintervall.

Konfidensintervallet = Uppmättvärde ± felmarginal

Om ett resultat av en undersökning landar i intervallet för felmarginalen anses undersökningen vara statistiskt säkerställd.

Exempel 2

Vi en undersökning svarade 10%10\%10% av de tillfrågade att de tänkte köpa ett schampo som företaget gjorde reklam för. Felmarginalen på 95%95\%95% -nivå beräknades till 2,32,32,3 procentenheter. Inom vilket intervall kan man förvänta sig att schampot faktiskt kommer köpas av de tillfrågade?

Lösning

Det sanna värde är i  959595 av 100100100  fall att det är mellan (10±2,3)%\left(10\pm2,3\right)\%(10±2,3)% , alltså mellan  7,7%7,7\%7,7% och 12,3%12,3\%12,3% av de tillfrågade som kommer köpa schampot.

I fem fall av hundra är felmarginalen för liten och det sanna värdet ligger utanför intervallet.

Statistisk signifikans

Statistisk signifikans är ett mått på hur osannolikt det är att tillfälligheter gett det uppfattade sambanden. Genom olika mindre testgrupper kan man värdera och vikta sannolikheten för att utfallen är slumpmässiga eller sanningsenliga och på så vi fast slå en statistisk signifikans.

Att räkna ut såna sannolikheter, så kallade signifikansvärden, är lite klurigt och inget vi lär vi oss i denna kurs. Men det kan ändå vara bra att känna till vad det är.

Om olika konfidensintervall inte överlappar varandra säger man att undersökningen är statistiskt säkerställ, eller statistiskt signifikant.

Exempel 3

Andelen elever som har med sig frukt till skolan har i en undersökning visat sig minska med tiden.

År 200020002000 andel medhavd frukt  (64±5) %\left(64\pm5\right)\text{ }\%(64±5) % 

År 201020102010 andel medhavd frukt  (53±5) %\left(53\pm5\right)\text{ }\%(53±5) % 

År 202020202020  andel medhavd frukt  (49±5) %\left(49\pm5\right)\text{ }\%(49±5) % 

Är minskningen statistiskt signifikant mellan åren i undersökningen?

Lösning

Vi beräknar konfidensintervallen för åren.

Intervallet 200020002000 var 595959 till 69 %69\text{ }\%69 % 

Intervallet 201020102010 var 484848 till 58 %58\text{ }\%58 % 

Intervallet 202020202020 var 444444 till 54  %54\text{ }\text{ }\%54 % 

Då vi ser att intervallen överlappar mellan  201020102010 och  202020202020 är den ökningen inte signifikant. Men mellan åren  200020002000 och  201020102010 överlappar inte intervallen, vilket ger en statistiskt signifikant (säkerställd) minskning.