00:00
00:00
Så hjälper Eddler dig:
Videor som är lätta att förstå Övningar & prov med förklaringar
Allt du behöver för att klara av nationella provet
Så hjälper Eddler dig:
Videor som är lätta att förstå Övningar & prov med förklaringar
Allt du behöver för att klara av nationella provet

Statistiskt material kan fördela sig på olika sätt beroende på vad man undersöker. Undersökningar som fördelar sig på så vis att resultaten med högst frekvens återfinns i närheten av medelvärdet och att frekvensen sedan avtar ”klockformat” symmetriskt åt båda håll från medelvärdet kallas normalfördelat

Normalfördelningskurvan

Normalfördelning

Det är verkligen inte alla statistiska resultat som är normalfördelade. Men ändå förvånansvärt många. När man genomför undersökningar och mätningar på fenomen i samhället och naturen är det inte ovanligt att de följer ett mönster som är just normalfördelat. Några exempel på normalfördelade material är blodtryck hos friska människor inom en viss åldersgrupp, vikt och längd på människor och olika arter av djur. Det kan gälla för tillverkningsprocesser där avvikelse finns i vissa intervall, tex vikt på glassar, längd på skruvar och volym på olika förpackningar. Med andra ord, vissa observationer ger mätdata som motsvarar det som kallas för normalfördelning. 

Om man gör ett histogram över ett normalfördelat material skulle det kunna se ut så här.

Normalfördelning med histogram

Typiskt för normalfördelat material är alltså att resultatet fördelar sig på ett speciellt sätt kring medelvärdet. I normalfördelningskurvan brukar man beteckna medelvärdet med den grekiska bokstaven μ\muμ, som utläses ”my”. Resultatet fördelar sig symmetriskt kring medelvärdet enligt en kurva som man ofta kallar för klockkurva (på grund av sin likhet med exempelvis kyrkklockor). Ju fler mätresultat, ju större likhet skulle histogrammets alla staplars höjd bli kurvan. Du ser den i bilden här nedan.

Klockkurva

Du kanske inte tycker att det ser ut som en klocka, men formen syftar till en klocka av äldre design. På engelska heter den”the bell curve” vilket lättare ger rätt association, det vill säga, en sådan man kan finna i kyrktorn eller på andra äldre byggnader. Exempelvis en av klockorna i den kända katedralen Notre-Dame i Paris.

Kurvan kan vara olika smal och hög. Men gemensamt för allt normalfördelat material är att det är symmetriskt kring sitt medelvärde och det man kallar ”klockformat”.

Normalfördelningskurva

Vi ska nu titta på vad som får kurvan att se ut på olika vis.

Standardavvikelse och normalfördelning

För att förstå normalfördelning behöver du även känna till och förstå standardavvikelse. Kurvans utseende är nämligen ett resultat av den.

Kurvan delas in i olika intervall efter antal standardavvikelser från medelvärdet. I ett normalfördelat material ska mätresultaten fördela sig på följande vis.

Normalfördelning delintervall

  • ca 50%50\%50% av värdena ligger under respektive över medelvärdet.
  •  68,26%68,26\%68,26%  befinner sig inom medelvärdet ± 111 standardavvikelse.
  •  95,45%95,45\%95,45%  befinner sig inom medelvärdet ± 222 standardavvikelser.
  •  99,73%99,73\%99,73% befinner sig inom ± 333 standardavvikelser.

Eftersom att denna fördelning alltid ska infinna sig på ett normalfördelat material kommer standardavvikelsen påverka kurvans utseende på följande vis.

Ett lågt värde på standardavvikelsen, vilket motsvarar en liten spridning på datamängdens avvikelser från medelvärdet, ger en hög och smal kurva.

En undersökning som däremot har en större standardavvikelse, eller med andra ord mätresultat med större variation, leder till att kurvan istället blir platt och bred.

Då medelvärdet i ett normalfördelat material motsvarar symmetrilinjen för kurvan och återfinns mitt i datamängden, sammanfaller alltid medianen och medelvärdet i ett normalfördelat material. 

Nu ser vi på ett exempel på hur man kan genomföra beräkningar med hjälp av normalfördelning.

Exempel 1

Vid en stickprovskontroll i en växthus vägde man 100010001000 tomater. Medelvärdet var 909090 gram och standardavvikelsen 101010 gram. 

a) Hur många procent av tomaterna som produceras kan man förvänta sig väger mer än  110110110 gram, om vi antar att tomaternas vikt följer en normalfördelningskurva?

b) Hur många tomater man kan en affär som köper in 10 00010\text{ }00010 000 tomater förvänta sig väger mer än 110110110 gram?

Lösning

a) Vi sätter in vårt medelvärde och standardavvikelse i en normalfördelningskurva. 

Då medelvärdet är 909090 gram motsvarar det μμμ och ska vara i kurvans mitt.
Vi får värdet för μ+σμ+σμ+σ genom att addera en standardavvikelse till medelvärdet, alltså 90+10=10090+10=10090+10=100 gram.
Värdet för två två avvikelser uppåt blir 90+210=11090+2\cdot10=11090+2·10=110 gram. Värdet för en standardavvikelse neråt motsvara  9010=8090-10=809010=80 gram osv.

Normalfördelning

Vi ser då att andelen tomater som väger mer än  110110110 gram motsvarar det rosa fältet i normalfördelningskurvan, alltså alla värden mindre än en standardavvikelse åt vänster i kurvan.

Genom att jämföra med normalfördelningskurvan med utsatta procentsatser, ser vi att det rosa området motsvarar summan av 0,13+2,142,27%0,13+2,14\approx2,27\%0,13+2,142,27% 

Vi kan alltså förvänta oss att det är ca 2,27%2,27\%2,27%  av tomater som väger mer än 110110110 gram.

b) Om man köper 10 00010\text{ }00010 000 tomater där 2,27%2,27\%2,27% förväntas väga med än 110110110 gram motsvarar det  10 0000,0227=22710\text{ }000\cdot0,0227=22710 000·0,0227=227 stycken tomater.

Sammanfattningsvis är normalfördelningen alltså inte ett lägesmått eller ett spridningsmått som du själv räknar ut. Istället är det en egenskap hos vissa statistiska material som man kan använda för att beräkna hur stor andel av resultatet som finns inom ett visst intervall.

Du kanske observerade att summan av de markerade intervallen i normalfördelning längst upp på denna lektion diffar med 0,010,010,01%. Det beror på avrundning. Med fler antal decimaler motsvarar hela klockan 100%100\%100%.

Exempel i videon

  • Längden på makrillar på en fångst på 2,12,12,1 ton är normalfördelat med standardavvikelsen 666 cm och medellängden 363636 cm. Hur många kilo makrillar är kortare än 303030 cm?
  • Vid tillverkning av en juiceförpackning i en maskin är volymen normalfördelad med standardavvikelsen 0,040,040,04 dl och medelvärdet 10,010,010,0 dl. För att förpackningen skall godkännas får inte volymen avvika med mer än 0,120,120,12 dl. Under en dag tillverkas 680068006800 förpackningar. Hur många av dessa får slängas varje dag?