Mitä tarkoittaa mediaani?
Mediaani on keskiluvun mitta: kun havaintoarvot järjestetään suuruusjärjestykseen, mediaani on keskimmäinen arvo (parittomassa joukossa) tai kahden keskimmäisen keskiarvo (parillisessa joukossa).
Se vastaa 50. prosenttipistettä eli puolta havainnoista on sen alapuolella ja puolta yläpuolella. Mediaani on vähemmän herkkä ääriarvoille kuin keskiarvo, minkä vuoksi sitä käytetään usein vinoutuneissa jakaumissa.
Mediaanin lyhyt määritelmä
- Mitä se on: arvo, joka jakaa joukon kahtia – 50 % arvoista ≤ mediaani ja 50 % ≥ mediaani.
- Suhde prosenttipisteisiin: mediaani = 50. prosenttipiste.
- Miksi tärkeä: robusti ääriarvoja vastaan; sopii vinoutuneille jakaumille (esim. tulot).
Näin lasket mediaanin
1) Parittoman luvun mediaani
- Järjestä arvot.
- Valitse keskimmäinen arvo.
Esim. 2, 3, 5, 6, 9 → mediaani = 5.
2) Parillisen luvun mediaani
- Järjestä arvot.
- Laske kahden keskimmäisen keskiarvo.
Esim. 1, 2, 4, 100 → kaksi keskimmäistä 2 ja 4 → mediaani = (2+4)/2 = 3.
Huomaa, että keskiarvo olisi 26,75, mikä korostaa mediaanin kestävyyttä ääriarvolle 100.
Mediaani vs. keskiarvo vs. tyyppiarvo
| Mitta | Kuvaus | Vahvuus | Heikkous |
|---|---|---|---|
| Mediaani | Keskimmäinen arvo | Robusti ääriarvoille | Ei käytä kaikkia arvoja laskussa |
| Keskiarvo | Arvojen summa / lukumäärä | Hyödyntää kaiken datan | Herkkä ääriarvoille |
| Tyyppiarvo | Yleisimmin esiintyvä arvo | Hyvä luokitteluasteikolle | Voi olla useita / puuttua |
Mediaani on robusti: sen breakdown point on 50 % (vasta kun yli puolet havainnoista on poikkeavia, mediaani “hajoaa”), kun keskiarvolla se on 0.
Mediaani käytännössä
- Tulot ja varallisuus: Mediaania suositaan, koska yksittäiset erittäin suuret tulot eivät vääristä keskitasoa. Esim. viranomaiset raportoivat mediaanituloja (”median household income”).
- Köyhyysrajat: OECD:n suhteellinen köyhyysraja määritetään mediaanitulon prosenttiosuutena.
- Suorituskykoseuranta: verkkosovelluksissa median latausaika kuvaa “tyypillistä” käyttäjäkokemusta paremmin kuin keskiarvo, kun data on vinoutunutta.
Hajonnan pariksi: IQR ja MAD
- Kvartiiliväli (IQR) = Q3 − Q1; median ympärillä oleva keskinen 50 % datasta.
- MAD (Median Absolute Deviation) = median(|x − median|). Skaalattu MAD (MAD/0,6745 ≈ MAD×1,4826) vastaa normaalijakaumassa keskihajontaa – robusti hajonnan mitta.
Painotettu mediaani ja ryhmitelty aineisto
Painotettu mediaani
Jos havainnoilla on painot (esim. luotettavuus, frekvenssi), painotettu mediaani on arvo, jonka kummallekin puolelle kertyy korkeintaan 50 % kokonaispainosta. Hyödyllinen mm. meta-analyyseissä ja mittaussarjoissa.
Ryhmitelty data (luokkatietotaulukko)
Jos aineisto on luokissa, mediaani voidaan approksimoida:
\text{mediaani} = L + \frac{\left(\frac{N}{2} – C_f\right)}{f}\times h
missä
L = mediaaniluokan alaraja, N = havaintojen määrä, C_f = edeltävien luokkien kertymä, f = mediaaniluokan frekvenssi, h = luokan leveys.
Todennäköisyysjakaumissa
Satunnaismuuttujan X mediaani on luku m, jolle pätee P(X \le m)\ge 1/2 ja P(X \ge m)\ge 1/2. Toisin sanoen mediaani puolittaa jakauman. Tämä määritelmä toimii sekä jatkuville että diskreeteille jakaumille.
Algoritmit ja suuret aineistot
Mediaanin voi löytää lineaarisessa ajassa valinta-algoritmeilla. Tunnettu median of medians -menetelmä tuottaa “hyvän pivotin” ja takaa pahimmillaankin O(n) -ajan. Käytännössä sitä hyödynnetään mm. quickselect-valinnassa ja mediaanisuotimissa.
Mediaani – Usein kysyttyä
Onko mediaani sama kuin 50. prosenttipiste?
Kyllä: 50. prosenttipiste = mediaani. Huomaa kuitenkin, että diskreetin aineiston prosenttipistelaskentaan on useita käytäntöjä; perusideana 50 % arvoista on ≤ mediaani.
Miksi mediaani sopii tulojen kuvaamiseen?
Tulojakaumat ovat yleensä vinoutuneita: harvat hyvin suuret arvot nostavat keskiarvoa, mutta mediaani pysyy keskellä jakaumaa. Siksi viranomaisraportit ja kansainväliset tilastot käyttävät usein mediaania.
Mitä tarkoittaa, että mediaani on “robusti”?
Se muuttuu vain vähän, vaikka yksittäisiä poikkeavia havaintoja lisättäisiin tai korvattaisiin – toisin kuin keskiarvo.
Mitä tarkoittaa mediaanipalkka?
Mediaanipalkka on palkkajakauman keskimmäinen arvo: kun kaikki palkansaajat järjestetään palkan mukaan, puolet ansaitsee vähemmän ja puolet enemmän.
Suomessa mediaania julkaistaan mm. Tilastokeskuksen palkkarakennetilastossa (tyypillisesti kokoaikaisten kuukausiansioiden mediaani) sekä kokeellisessa tulorekisterin palkat ja palkkiot -tilastossa (kuukausittainen palkka- ja palkkiotulojen mediaani). Siksi on hyvä tarkistaa, viitataanko kokoaikaisiin kuukausiansioihin vai laajempaan palkka- ja palkkiotulojen mittaan.
Ellei toisin mainita, Suomessa kuukausiansiot raportoidaan bruttoina (ennen veroja ja vähennyksiä).
Yhteenveto
Mediaani on keskimmäinen arvo, ja samalla 50. prosenttipiste. Se on robusti mitta vinoutuneille jakaumille ja käytännössä hyödyllinen mm. tulojen ja aikojen kuvaamisessa. Tarvittaessa käytä MAD:ia ja IQR:ää hajonnan kumppaneina; painotetussa ja ryhmitellyssä datassa käytä painotettua mediaania tai mediaaniluokan kaavaa.
Lähteet
- Wikipedia: Median – määritelmä, ominaisuudet ja todennäköisyysmääritelmä.
https://en.wikipedia.org/wiki/Median - Britannica: Mean, median and mode – perusmääritelmät ja parillisen joukon tapaus.
https://www.britannica.com/science/mean-median-and-mode - Wikipedia: Weighted median – määritelmä ja käyttö
https://en.wikipedia.org/wiki/Weighted_median
