Versj. 4
Denne versjonen ble publisert av Ida Scott 20. desember 2022. Artikkelen endret 194 tegn fra forrige versjon.

Man skiller mellom observerte statistiske fordelinger (frekvens- eller hyppighetsfordelinger) og teoretiske fordelinger (sannsynlighetsfordelinger).

I et statistisk materiale der det for hvert individ (hver observert enhet) er observert ett eller flere kjennetegn, som alder, inntekt eller lignende, kan man for eksempel finne fordelingen av individene etter alder. Man deler inn materialet i aldersklasser og teller hvor mange individer det er i hver klasse. I Statistisk årbok 2003 finnes i tabell 53 fordelingen av norske innbyggere per 01.01.2003 etter alder. Fra denne tabellen kan fordelingen i 10 års aldersintervaller sette opp (se tabell).

Fordelingen kan angis i absolutte tall, relative tall (andel) eller prosent. Det kan også settes opp en toveisfordeling etter for eksempel alder og kjønn, en treveisfordeling etter tre kjennetegn, og så videre.

En fordeling kan karakteriseres ved ulike statistiske mål: et gjennomsnitt kan angi hvor tyngdepunktet eller kanskje den mest typiske verdi i fordelingen ligger, mens et spredningsmål antyder hvor tett eller spredt observasjonene ligger rundt gjennomsnittet. Vanlige gjennomsnittsmål er det aritmetiske middeltall, som er summen av observasjonene dividert med antallet, og medianen eller midttallet, som ligger midt i det observerte materialet; det er den midterste verdien når vi ordner observasjonene etter stigende verdi. Blant spredningsmålene er standardavviket (engelsk standard deviation) det vanligste. Kvadratet av standardavviket kalles variansen. Denne finner man ved å ta differensen mellom observert verdi og gjennomsnitt for alle observasjonene, kvadrere disse differensene og dividere summen av dem med antall individer.

For et materiale ordnet i en klasseinndelt fordeling som ovenfor, kan man finne tilnærmede verdier av disse målene. Ved å henføre antallene til midtpunktene i klasseintervallene, er det aritmetiske gjennomsnittet av personenes alder tilnærmet lik

[(601 119 · 5) + (581 289 · 15) + (579 679 · 25) + (697 355 · 35) + (634 556 · 45) + (585 481 · 55) + 361 907 · 65) + (305 803 · 75) + (205 063 · 85)]/4 552 252 = 38,5 år.

Medianen, den midterste verdien når personene ordnes etter alder, ligger i klasseintervallet 30−39 år, nær 37 år. Variansen blir tilnærmet lik

[601 119 · (5 − 38,5)2 + 581 289 · (15 − 38,5)2 + ... + 205 063 · (85 − 38,5)2]/4 552 252 = 527,4.

Standardavviket blir dermed 23 år.

I statistisk metodelære definerer man teoretiske fordelinger som angir sannsynligheter for de forskjellige verdiene (eller intervaller av verdier) av en stokastisk variabel; for eksempel sannsynligheten for at alderen til en tilfeldig valgt person skal falle i bestemte intervaller på skalaen. Eksempler er den binomiske fordelingen og normalfordelingen; se også målefeil. Det defineres også teoretiske statistiske mål på fordelingers midtpunkt og spredning; forventningsverdien, som tilsvarer det aritmetiske gjennomsnittet (se statistisk forventning), og det teoretiske standardavviket.

Alder Antall Relative tall (andel) Prosent
0–9 år 601 119 0,132 13,2
10–19 år 581 289 0,128 12,8
20–29 år 579 679 0,127 12,7
30–39 år 697 355 0,153 15,3
40–49 år 634 556 0,139 13,9
50–59 år 585 481 0,129 12,9
60–69 år 361 907 0,080 8,0
70–79 år 305 803 0,067 6,7
80– 205 063 0,045 4,5
Til sammen 4 552 252 1,000 100
  • Lillestøl, Jostein: Sannsynlighetsregning og statistikk, 5. utg., 1997
  • Sverdrup, Erling: Lov og tilfeldighet, b. 1, 2. utg., 1973