00:00
00:00
Så hjälper Eddler dig:
Videor som är lätta att förstå Övningar & prov med förklaringar
Allt du behöver för att klara av nationella provet
Så hjälper Eddler dig:
Videor som är lätta att förstå Övningar & prov med förklaringar
Allt du behöver för att klara av nationella provet

Percentiler och lådagram visar på spridningen hos en datamängd.

Percentiler

Beroende på vad en datamängden motsvarar så kan det vara intressant att dela in den i percentiler, vilket betyder hundradelar.

Det innebär att man ordnar observationerna i storleksordning och sedan delar in datamängden i hundradelar. Då kommer ”50-percentilen”,  P50P_{50}P50 , dela observationerna på hälften och motsvara medianen.

En percentil är alltså det värde som delar datamängden så att en viss procent av observationerna hamnar nedanför och resten ovanför. Till exempel är ”30-percentilen”, P30P_{30}P30, det värde som delar observationerna så att 303030 procent av dem är mindre och 707070 procent är större än värdet på P30P_{30}P30.

Ibland är det lämpligt att dela upp datamängden i kvartiler, fjärdedelar. Då delar man upp materialet i fyra delar och P25P_{25}P25 kallas den nedre kvartilen och  P75P_{75}P75 den övre kvartilen.  P50P_{50}P50 är som redan sagt medianen. Med hjälp av kvartilerna kan man rita upp ett spridningsdiagram kallat lådagram för att redovisa sin datamängd grafiskt.

Lådagram

Lådagram är ett diagram som visar en datamängds spridning. Den redovisade datamängden i lådagrammet motsvarar, precis som ett cirkeldiagram alltid 100100100 %. När man ritar ett lådagram delar man in datamängden i kvartiler.

Kvartiler på lådagram

Kvartiler

Ordet kvartil kommer från ordet kvart, som betyder fjärdedel. Precis som det låter delar alltså kvartilerna in undersökningsmaterialet i fyra lika stora delar. Till skillnad från i cirkeldiagrammet ser dock inte dessa delar lika stora ut då det är själva poängen med lådagrammet att istället visa hur datamängden sprider ut sig i varje kvartil .

Som vi vet sedan tidigare delar medianen alltid en datamängd på hälften. I ett lådagram kallas medianen för kvartil Q₂. Den markeras som ett streck mitt i lådan.

Om antalet observationer är udda kommer medianen vara observationen precis i mitten och därför inte tas hänsyn till vid beräkning av nedre och övre kvartil, se nedan.

Om antalet observationer däremot är jämnt kommer medianen utgöras av snittet mellan de två observationerna i mitten och de in sin tur kommer därför ligga i nedre respektive övre halvan av datamängden när vi sedan beräknar nedre och övre kvartil.

Man kallar Q₁ för den nedre kvartilen. Den motsvarar medianen för den nedre halvan av datamängden. I lådagrammet markeras den nedre kvartilen med den vänstra kanten på lådan.

Kvartil avstånd på lådagram

Liknade gäller för den övre kvartilen Q₃. Den motsvarar medianvärdet på den övre halva av datamängden.

Kvartilavståndet är differensen mellan Q₃ och Q₁ och således längden på ”lådan”. I lådan befinner sig  50%50\%50% av datamängden.

Variationbredd

Variationsbredden motsvarar differensen mellan det största och minsta värdet i en datamängd och därför kommer hela låddiagrammets längd alltid motsvara variationsbredden.

Variationsbredd på lådagram

Som ett resultat av att Q₂ delar datamängden på mitten, motsvarar antalet resultat till vänster om sträcket mitt i lådan 505050% av datamängden. På liknande vis kommer antalet till höger om Q₂ motsvara de andra 505050% av datamängden.

Då Q₁ delar den nedre halvan av datamängden på mitten, motsvara antalet på vänster sida om nedre kvartilen 252525% av hela datamängden och antalet mellan Q₁ och Q₂ också 252525%. På samma vis delar Q₃ den övre halvan av datamängden i två lika stora delar. 

Sammanfattningsvis kan vi konstatera att kvartilerna delar in datamängden i fjärdedelar. På detta sätt kommer antalet observationer mellan varje kvartil motsvara 252525%  av hela datamängden.

Beroende på antalet observationer är procentsatserna lite ungefärliga då en median ibland ingår i materialet och i andra fall inte. 

Exempel 1

Visa följande datamängds spridning i ett lådagram.
Tabell

Lösning

Vi börjar med att skriva observationerna i storleksordning. Detta gör vi får att kunna ta fram medianen, som i lådagrammet kallas Q2Q_2Q2.

Medianen är talet i mitten om datamängden står i storleksordning. Eftersom att datamängden innehåller ett jämt antal observationer, nämligen 181818 stycken, hamnar medianen i mitten med 9 tal på varsin sida, markerat med rött nedan. 

 1, 0, 0, 0, 1, 1, 1, 1, 4-1,\text{ }0,\text{ }0,\text{ }0,\text{ }1,\text{ }1,\text{ }1,\text{ }1,\text{ }41, 0, 0, 0, 1, 1, 1, 1, 4  I  4, 4, 4, 5, 5, 6, 8, 8, 10\text{ }4,\text{ }4,\text{ }4,\text{ }5,\text{ }5,\text{ }6,\text{ }8,\text{ }8,\text{ }10 4, 4, 4, 5, 5, 6, 8, 8, 10  

När detta händer beräknar vi medianen genom att addera de två mittersta värdena och dela med två, i detta fall dock överflödigt då vi ser att båda talen är fyra och således även deras snitt.

 Q2=4Q_2=4Q2=4 

Vi tar sedan fram nedre kvartilen,  Q1Q_1Q1 ,  vilket är medianen på den nedre halvan av datamängden.
 1, 0, 0, 0, 1, 1, 1, 1, 4-1,\text{ }0,\text{ }0,\text{ }0,\text{ }1,\text{ }1,\text{ }1,\text{ }1,\text{ }41, 0, 0, 0, 1, 1, 1, 1, 4 

Nedre kvartilen är 111

Till sist tar vi fram övre kvartilen, vilket är medianen på den övre halvan av datamängden.
 4, 4, 4, 5, 5, 6, 8, 8, 104,\text{ }4,\text{ }4,\text{ }5,\text{ }5,\text{ }6,\text{ }8,\text{ }8,\text{ }104, 4, 4, 5, 5, 6, 8, 8, 10 

Övre kvartilen är 555 . 

Minsta värdet är 1-11 och största 101010. Datamängden motsvarar därmed en lådagram som ser ut på följande vis.

Lådagram

I lektionen Digitala metoder för att bestämma lägesmått och spridningsmått går vi igenom hur du enkelt kan rita lådagram man GeoGebra.

Tips kring lådagram

Observera några viktiga saker till sist.

  • Tallinjen under lådagrammet måste alltid vara skalenlig, alltså ha lika stora steg längs hela lådagrammet.
  • En viss observation, tex. poängen 444 kan finnas i två intilliggande kvartiler. I detta fall finns det en person med poäng 444 i första halvan av ”lådan” och tre personer med poängen 444 i andra halvan av ”lådan”.
  • Vi har ingen annan information än start och slut för en kvartil, det gör att alla observationer utom en skulle kunna vara samma i en kvartil.
  • När en del av lådagrammet är liten betyder det att många värden är hopträngda i det intervallet och kan vara särskilt intressant vid analysen av observationerna.

Normalfördelning

Ett del datamängder fördelar sig enligt en normalfördelningskurva som alltid är formad efter följande percentiler.

Normalfördelningskurvan

Men mer om detta i lektionen om normalfördelning.

Exempel i videon

  • På ett läxförhör fick en grupp elever följande antal rätt:
    4, 4, 5, 6, 6, 7, 12, 14, 16, 16, 18
    a) Rita ett lådagram utifrån resultatet och ange kvartilavståndet.
    b) Hur många procent av eleverna har mellan 16 och 18 poäng?