00:00
00:00
Så hjälper Eddler dig:
Videor som är lätta att förstå Övningar & prov med förklaringar
Allt du behöver för att klara av nationella provet
Så hjälper Eddler dig:
Videor som är lätta att förstå Övningar & prov med förklaringar
Allt du behöver för att klara av nationella provet

I den här lektionen får du en repetition av statistik. Vi repeterar begreppen median, medelvärde, variationsbredd och typvärde. Återvänd till respektive lektion om du känner dig osäker och fördjupa sedan din förståelse i lektionen lägesmått och spridningsmått.

Statistik inom matematik

Statistik kallas den del inom matematiken som sammanställer, tolkar och analyserar information om något. Det kan vara analys av människor, djur, naturs beteende eller egenskaper, om ekonomi eller egentligen vad som helst. Med statistiska beräkningar försöker man hitta mönster, logik, samband och kunna göra slutledningar om t.ex. människors åsikter, tankar eller värderingar.

Under historiens gång har matematiker förfinat denna gren inom matematiken och utvecklat metoder som ger analyserna större och större samstämmighet med verkligheten och olika skeenden.

Grundbegrepp inom statistiken

I lektionen går vi igenom de grundbegrepp du behöver kunna för att själv göra sådana undersökningar. Gå till respektive lektion för att repetera enskilda begrepp eller få en fördjupning. Viktiga grundbegrepp att kunna är följande.

Statistik

Den gren inom matematiken som sysslar med insamling, utvärdering, analys och presentation av data eller information kallas statistik.

Datamängd

Alla de olika resultat och/eller mätvärden man får in vid en undersökning kallas för datamängden.

Observation

De resultat och/eller iakttagelser man gör i samband med en undersökning kallas för observationer. Observationerna delas sedan in i olika observationsvärden för att lättare sortera och kategorisera de olika observationerna.

Frekvens

Antalet gånger varje observationsvärde förekommer kallas för observationens frekvens

Relativ frekvens

Frekvensen angiven som en andel, oftast i procent, kallas relativ frekvens.

Lägesmått

Lägesmått är värden som sammanfattar alla mätvärden i en datamängd med ett enda representativt värde.

Spridningsmått

Spridningsmått anger hur observationerna i datamängden varierar kring lägesmåttens värden.

Medelvärde

Medelvärdet anger datamängdens genomsnittliga värde.

 Medelva¨rde=\text{Medelvärde}=Medelvärde= Summan av alla va¨rdenAntal va¨rden\frac{\text{Summan av alla värden}}{\text{Antal värden}}Summan av alla värdenAntal värden  

Median

Medianen anger mittenvärdet i datamängden när den står i storleksordning. Vid jämnt antal värden blir medianvärdet medelvärdet av de två mittersta värdena.

Typvärde

Typvärdet motsvarar det vanligast förekommande värdet i en datamängd. Alltså det värde med högst frekvens.

Variationsbredd

Variationsbreddenär ett spridningsmått som anger skillnaden mellan det största och det minsta värdet.

Som vi tidigare nämnt presenteras spridningsmått och lägesmått ofta tillsammans för att beskriva en undersökningsresultat så bra som möjligt.

Exempel 1

Två personer kastar dart. Nedan följer deras poäng för fyra kast var.

Poäng person 1
10,10,10,10{ 10, 10, 10, 10 }

Poäng person 2
0,0,0,40{ 0, 0, 0, 40 }

För vem gick det bäst?

Lösning

Båda personerna fick totalpoängen 404040 och medelvärdet 101010 poäng. Men det är ganska stor skillnad mellan de två personernas resultat.

Person 1 är antalet poäng väldigt samlat kring medelvärdet. Eller rättare sagt, inget värde avviker alls från medelvärdet 101010. Alla värden är till och med lika med medelvärdet. 

Däremot avviker alla värdena ganska mycket från medelvärdet 101010 poäng för person 2. Därmed har person 2 en större spridning.

Sammanfattningsvis har personerna olika spridning, även om medelvärdet är detsamma. Men för vem det gick bäst? Ja, det beror nog på vem du frågar!

De olika måtten visar alltså olika saker. Därför är det viktigt att tänka efter en extra gång hur representativt eller rättvisande ett mått verkligen är i förhållande till datamängden.

I lektionen lägesmått och spridningsmått går vi igenom fler exempel på hur man genomför beräkningar på de olika värdena.

Olika diagram

Beroende på vilken datamängd du vill presentera lämpas sig olika diagram olika bra. Här repeterar vi nu några av de diagram vi gick igenom mer ingående i lektionen Diagram och tabeller.

Stolpdiagram

Ett stolpdiagram lämpar sig väl då observationerna motsvarar vissa värden, ofta numeriska heltalsvärden.

Stolpdiagram

Cirkeldiagram

Om man har ett litet antal olika observationer kan cirkeldiagrammet vara ett bra sätt att redovisa sin data.

Cirkeldiagram

De olika sektorerna i cirkeln motsvarar tillsammans 100%100\%100% av datamängden. Vinkeln för varje sektor beräknas genom att multiplicera andelen i decimalform med 360360^{\circ}360

Histogram

I lektionen lägesmått och spridningsmått presenterar vi ett nytt diagram som kallas för histogram.

Histogram

I histogrammet delar man in datamängden i olika intervall, så kallade klasser, för att få ett mer överskådligt diagram om datamängden är väldigt utspridd.

Lådagram

Lådagram är ett diagram som visar spridningsmått på ett tydligt vis och är nytt för kursen. I lektionen lådagram går vi ingående igenom hur man läser av och konstruerar ett lådagram, men redan nu får ni ett exempel på hur de kan se ut nedan.

Kvartiler på lådagram

Nya lägesmått och spridningsmått

Spridningsmått och lägesmått presenteras ofta tillsammans för att beskriva en undersökningsresultat så bra som möjligt.

I högstadiets kurser och Matematik 1 gick vi ingående igenom lägesmåtten medelvärde, median och typvärde. Där diskuterade vi även att de olika lägesmåtten passar bra att använda i olika situationer. Genom att känna till hur datamängdens observationer är fördelade kan man lättare avgöra vilket lägesmått som lämpar sig bäst.

I denna kurs kommer vi att fördjupa lägesmåtten genom att jobba med material som är normalfördelade. Det innebär att de fördelas sig på ett särskilt vis kring medelvärdet enligt en kurva som även finns på formelbladet för kursen.

Normalfördelningskurvan

Är datamängden någorlunda normalfördelad är medelvärdet ett bra lägesmått. Däremot kan medianen eller typvärdet vara ett mer rättvisande lägesmått om materialet är snedfördelat. Med andra ord får man vara observant på vilket mått som ger det tydligaste och mest sanningsenliga informationen. Sammanfattningsvis gäller att för olika datamängder är de tre lägesmåtten olika missvisande.

Återvänd till lektionen medelvärde, median och typvärde, samt lägesmått och spridningsmått  om du känner att du behöver repetera mer.

I en datamängd där observationerna har en liten spridning är de flesta värden nära varandra. Däremot säger man om en datamängd där värdena skiljer sig mycket från varandra, att spridningen är stor.

Vi har redan bekantat oss med spridningsmåttet variationsbredd.

I kommande lektioner kommer vi även introducera spridningsmåtten standardavvikelse, varians och percentilavstånd.

Korrelation och kausalitet

Ibland finns samband mellan två olika datamängder. Då kan man göra en så kallad två-variabelanalys. Här är två centrala begrepp att repetera.

Korrelation betyder att två olika variabler följs åt på ett tydligt sätt. Hittills har vi fokuserat på linjär korrelation.

Positiv linjära korrelation gäller när  två olika variabler följs åt på viset att när den ena ökar, ökar även den andra. Vid negativ korrelation minskar när den första variabeln ökar.

Korrelationen kan vara olika stark, vilket blir tydligast om man ritar ett spridningsdiagram och iakttar hur samlade de olika punkterna är längs en linje eller en annan typ av funktion. När det finns en tydlig korrelation kan man anpassa modeller som beskriver denna korrelation. Det kallas regression eller funktionsanpassning. I lektionerna Regressionsanalys med Geogebra och Regressionsanalys med Grafräknare i tittar vi närmare på hur man kan göra regressionen med hjälp av digitala verktyg.

Kausalitet beskriver om det finns ett orsakssamband mellan två variabler. 

Även om det finns en korrelation mellan variablerna som motsvarar punkterna i spridningsdiagrammet, så är det inte säkert att det finns ett orsakssamband, eller med andra ord råder kausalitet, mellan variablerna. Det kan vara slumpen som gör att det ser ut att finnas ett samband även om det egentligen inte gör det. Två händelser där man sett en korrelation mellan mätvärdena kan till exempel bero på en tredje händelse. Men om kausalitet råder mellan två fenomen, kallas det ena orsak och det andra verkan.