30 Giugno 2023

Media e mediana: poche analogie ma molte differenze

By lcarta
  luciano

Molto spesso si sente parlare di media e di mediana di una serie di dati statistici. Ma come al solito in testi di articoli di giornale superficiali si tende a confondere i due concetti e a considerarli, visto che si “rassomigliano”, come se fossero la stessa cosa. Ma non è cosi e vi porterò un esempio facile facile.

Cosa sono media e mediana?La media e la mediana fanno parte di quello che i matematici chiamano indici di posizione. L’unica cosa che li accomuna sono che entrambi sono i valori numerici che meglio descrivono una serie di dati della popolazione statistica. Anche se esistono numerosi tipi di media, nel linguaggio ordinario, con il termine media si intende comunemente la media aritmetica e nel seguito faremo riferimento parlando di media solo della media aritmetica. Il valore mediano è invece l’unità che occupa esattamente la posizione centrale nella distribuzione ordinata dei valori (metà sopra e metà sotto il valore mediano) vediamo esempi.

La media come valore centrale: il reddito medio di una città come migliore stima della ricchezzaSupponiamo ad esempio un caso che riguarda il reddito di una città formata ipoteticamente da 4 abitanti:

12 342,1415 365,9810 985,4519 899,98

Una serie di valori (nell’esempio i redditi) di una città A formata ipoteticamente da 4 abitanti

Supponiamo di voler fare una statistica sulla ricchezza della nostra città A (di 4 abitanti), cioè si vorrebbe avere una idea di quale siano gli euro che mediamente i nostri abitanti guadagnano. In questo caso si sceglie come valore di riferimento la media aritmetica calcolata sommando tutti i valori a disposizione e dividendo il risultato per il numero complessivo dei dati. Per farsi una idea quindi di quanto sia ricca la nostra città si fa la media dei redditi sommandoli e dividendo per 4 (il numero degli abitanti) Facendo i conti otteniamo il valore di 14 648,39 euro Questo è il valore che si avvicina ai redditi dei 4 abitanti considerati nel complesso. Cosa vuol dire? significa che tale valore può essere usato ad esempio per segnalare quali siano i redditi inferiori al valore medio. Nel caso facessimo parte della giunta comunale o il sindaco di quella città potremo adottare misure per la redistribuzione del reddito in modo da fare in modo che gli abitanti vivano nelle medesime condizioni economiche o anche tante altre considerazioni. Matematicamente abbiamo un unico numero che rappresenta il reddito della città. Se prenderemo la media possiamo affermare che il reddito medio della città A è di 14 648,39 euro e possiamo considerare l’intera città come se fosse una sola persona che guadagna annualmente quella cifra.

Un problema di rappresentanza!Attenzione, consideriamo ora che nella nostra città ci siano i seguenti redditi:

12 342,1415 365,9810 985,454 198 899,98

Una serie di valori (nell’esempio i redditi) di una città B formata ipoteticamente da 4 abitanti

In questo caso nella città B i redditi sono molto disomogenei. Supponiamo di voler fare la statistica di prima: calcoliamo il valore medio sommando i redditi e dividendo per 4, ed otteniamo 1 059 398,39 euro. In questa città dunque il reddito medio è di oltre 1 milione di euro! E’ una città di persone ricche? Guardando bene i redditi si osserva che in realtà solo 1 persona su 4 guadagna oltre 4 milioni di euro all’anno. Al contrario il resto degli abitanti assolutamente ha un reddito inferiore e non di certo gode della ricchezza del milionario “ricco” residente in città. Questo fenomeno è molto più marcato se si considerano città anche molto più popolose dove per la presenza di una sola persona estremamente ricca fa si che il reddito medio sia troppo lontano dal vero.

La mediana come valore centrale: il reddito mediano di una città come migliore stima della ricchezza

Questo è un esempio abbastanza facile del caso in cui il valore medio non è rappresentativo della popolazione. Allora come ci si comporta in questi casi? se vogliamo avere un valore di posizione (centrale) per poter avere una idea di quale sia il reddito che di più si avvicina a quello della popolazione non possiamo assolutamente usare la media. Questo è un caso che i matematici definiscono di distribuzione asimmetrica e il valore centrale che meglio rappresenta questa distribuzione è allora la mediana. 

  1. si ordinano i dati in ordine crescente;
  2. se il numero di dati è dispari la mediana corrisponde al valore centrale, ovvero al valore che occupa la posizione a metà
  3. se il numero di dati è pari, la mediana è stimata utilizzando i due valori che occupano le posizioni calcolandone la media
  4. ordinando i redditi, abbiamo: 10 985,45 — 12 342,14 — 15 365,98 — 4 198 899,98

Questo è quello che dovremmo fare nella nostra serie di dati della città Bil numero dei dati è pari e prendiamo quelli che sono al centro cioè: 12 342,14 — 15 365,98 facciamo la media tra 12 342,14 e 15 365,98 ed otteniamo 13 854, 06 euro. Questo valore ottenuto è il valore del reddito mediano della città. E’ in effetti un valore molto più vicino alla realtà della città in quanto i redditi della maggior parte degli abitanti sta “vicino” a quel valore, in particolare come si può notare metà dei redditi stanno sotto (i due redditi di 10 985,45 e 12 342,14 euro) e l’altra metà stanno sopra (gli altri due di 15 365,98 e 4 198 899,98) ed è proprio quest’ultimo il concetto intuitivo di mediana. Nel caso della città A invece la mediana risulta di 17 632,98 euro, molto vicino alla media di 14 648,39 euro. Questo avviene perché i redditi sono molto vicini tra loro (non abbiamo valori “anormali”).

Quali sono le differenze tra media e mediana e quando usare una o l’altra?Entrambi i valori quindi sono rappresentativi di una popolazione, quando essa è abbastanza omogenea (quello che si chiama distribuzione simmetrica) allora la media e la mediana sono molto vicine, pur restando concettualmente due cose differenti. Visto che la proprietà della mediana è di rendere minima la somma dei valori assoluti degli scarti, essa è come abbiamo visto preferibile quando non si vuole che un eventuale dato atipico comprometta la stabilità dell’indice di posizione, come avviene nel caso di una distribuzione asimmetrica.

Due parole sull’età media e l’età mediana dei contagi da Sars-Cov-2Lo spirito che mi ha spinto a scrivere questo articolo è la confusione generata dalla stampa tradizionalista nel confondere l’età media dei contagiati con l’età mediana per una tipica fallacia nel considerare sinonimi due parole simili. Essendo infatti la distruzione delle età dei contagiati molto asimetrica, se ricordate in un primo momento colpiva soprattutto le persone anziane ed ultimamente i più giovani, l’età media risulta in questo caso molto alta e non è molto rappresentativa della situazione attuale dovuta ad un veloce ed asimmetrico abbassamento. Questo è un caso in cui età media ed età mediana sono molto lontane tra loro come nei redditi della città B spiegati sopra. E’ una situazione naturalmente molto delicata in cui la confusione non ci viene in aiuto. Facendo chiarezza ribadisco che: l’età mediana rappresenta il valore che separa in due grandi comparti le età delle persone contagiate: se l’età mediana è ad esempio di 30 anni vuol dire che metà dei contagiati ha meno di 30 anni e l’altra metà ne ha di più. Essendo però ultimamente la distribuzione delle età dei contagiati molto asimetrica l’età media non è rappresentativa e quindi può portare a considerazioni errate qualora si volesse evidenziare quali siano le fascia di età più colpite. Ecco perchè ultimamente si considera l’età mediana al posto dell’età media.   Luciano