Mitä tarkoittaa mediaani?

Mediaani on keskiluvun mitta: kun havaintoarvot järjestetään suuruusjärjestykseen, mediaani on keskimmäinen arvo (parittomassa joukossa) tai kahden keskimmäisen keskiarvo (parillisessa joukossa).

Se vastaa 50. prosenttipistettä eli puolta havainnoista on sen alapuolella ja puolta yläpuolella. Mediaani on vähemmän herkkä ääriarvoille kuin keskiarvo, minkä vuoksi sitä käytetään usein vinoutuneissa jakaumissa. 

Mediaanin lyhyt määritelmä

  • Mitä se on: arvo, joka jakaa joukon kahtia – 50 % arvoista ≤ mediaani ja 50 % ≥ mediaani. 
  • Suhde prosenttipisteisiin: mediaani = 50. prosenttipiste
  • Miksi tärkeä: robusti ääriarvoja vastaan; sopii vinoutuneille jakaumille (esim. tulot). 

Näin lasket mediaanin

1) Parittoman luvun mediaani

  1. Järjestä arvot.
  2. Valitse keskimmäinen arvo.

Esim. 2, 3, 5, 6, 9 → mediaani = 5.

2) Parillisen luvun mediaani

  1. Järjestä arvot.
  2. Laske kahden keskimmäisen keskiarvo.

Esim. 1, 2, 4, 100 → kaksi keskimmäistä 2 ja 4 → mediaani = (2+4)/2 = 3.

Huomaa, että keskiarvo olisi 26,75, mikä korostaa mediaanin kestävyyttä ääriarvolle 100. 

Mediaani vs. keskiarvo vs. tyyppiarvo

MittaKuvausVahvuusHeikkous
MediaaniKeskimmäinen arvoRobusti ääriarvoilleEi käytä kaikkia arvoja laskussa
KeskiarvoArvojen summa / lukumääräHyödyntää kaiken datanHerkkä ääriarvoille
TyyppiarvoYleisimmin esiintyvä arvoHyvä luokitteluasteikolleVoi olla useita / puuttua

Mediaani on robusti: sen breakdown point on 50 % (vasta kun yli puolet havainnoista on poikkeavia, mediaani “hajoaa”), kun keskiarvolla se on 0. 

Mediaani käytännössä

  • Tulot ja varallisuus: Mediaania suositaan, koska yksittäiset erittäin suuret tulot eivät vääristä keskitasoa. Esim. viranomaiset raportoivat mediaanituloja (”median household income”). 
  • Köyhyysrajat: OECD:n suhteellinen köyhyysraja määritetään mediaanitulon prosenttiosuutena. 
  • Suorituskykoseuranta: verkkosovelluksissa median latausaika kuvaa “tyypillistä” käyttäjäkokemusta paremmin kuin keskiarvo, kun data on vinoutunutta. 

Hajonnan pariksi: IQR ja MAD

  • Kvartiiliväli (IQR) = Q3 − Q1; median ympärillä oleva keskinen 50 % datasta.
  • MAD (Median Absolute Deviation) = median(|x − median|). Skaalattu MAD (MAD/0,6745 ≈ MAD×1,4826) vastaa normaalijakaumassa keskihajontaa – robusti hajonnan mitta

Painotettu mediaani ja ryhmitelty aineisto

Painotettu mediaani

Jos havainnoilla on painot (esim. luotettavuus, frekvenssi), painotettu mediaani on arvo, jonka kummallekin puolelle kertyy korkeintaan 50 % kokonaispainosta. Hyödyllinen mm. meta-analyyseissä ja mittaussarjoissa. 

Ryhmitelty data (luokkatietotaulukko)

Jos aineisto on luokissa, mediaani voidaan approksimoida:

\text{mediaani} = L + \frac{\left(\frac{N}{2} – C_f\right)}{f}\times h

missä

L = mediaaniluokan alaraja, N = havaintojen määrä, C_f = edeltävien luokkien kertymä, f = mediaaniluokan frekvenssi, h = luokan leveys. 

Todennäköisyysjakaumissa

Satunnaismuuttujan X mediaani on luku m, jolle pätee P(X \le m)\ge 1/2 ja P(X \ge m)\ge 1/2. Toisin sanoen mediaani puolittaa jakauman. Tämä määritelmä toimii sekä jatkuville että diskreeteille jakaumille. 

Algoritmit ja suuret aineistot

Mediaanin voi löytää lineaarisessa ajassa valinta-algoritmeilla. Tunnettu median of medians -menetelmä tuottaa “hyvän pivotin” ja takaa pahimmillaankin O(n) -ajan. Käytännössä sitä hyödynnetään mm. quickselect-valinnassa ja mediaanisuotimissa. 

Mediaani – Usein kysyttyä

Onko mediaani sama kuin 50. prosenttipiste?

Kyllä: 50. prosenttipiste = mediaani. Huomaa kuitenkin, että diskreetin aineiston prosenttipistelaskentaan on useita käytäntöjä; perusideana 50 % arvoista on ≤ mediaani. 

Miksi mediaani sopii tulojen kuvaamiseen?

Tulojakaumat ovat yleensä vinoutuneita: harvat hyvin suuret arvot nostavat keskiarvoa, mutta mediaani pysyy keskellä jakaumaa. Siksi viranomaisraportit ja kansainväliset tilastot käyttävät usein mediaania. 

Mitä tarkoittaa, että mediaani on “robusti”?

Se muuttuu vain vähän, vaikka yksittäisiä poikkeavia havaintoja lisättäisiin tai korvattaisiin – toisin kuin keskiarvo.

Mitä tarkoittaa mediaanipalkka

Mediaanipalkka on palkkajakauman keskimmäinen arvo: kun kaikki palkansaajat järjestetään palkan mukaan, puolet ansaitsee vähemmän ja puolet enemmän. 

Suomessa mediaania julkaistaan mm. Tilastokeskuksen palkkarakennetilastossa (tyypillisesti kokoaikaisten kuukausiansioiden mediaani) sekä kokeellisessa tulorekisterin palkat ja palkkiot -tilastossa (kuukausittainen palkka- ja palkkiotulojen mediaani). Siksi on hyvä tarkistaa, viitataanko kokoaikaisiin kuukausiansioihin vai laajempaan palkka- ja palkkiotulojen mittaan. 

Ellei toisin mainita, Suomessa kuukausiansiot raportoidaan bruttoina (ennen veroja ja vähennyksiä).  

Yhteenveto

Mediaani on keskimmäinen arvo, ja samalla 50. prosenttipiste. Se on robusti mitta vinoutuneille jakaumille ja käytännössä hyödyllinen mm. tulojen ja aikojen kuvaamisessa. Tarvittaessa käytä MAD:ia ja IQR:ää hajonnan kumppaneina; painotetussa ja ryhmitellyssä datassa käytä painotettua mediaania tai mediaaniluokan kaavaa. 

Lähteet

Katso myös nämä!