Quantili, Quartili e Percentili
Oltre alla mediana, che divide a metà un insieme di dati ordinati, si possono definire altri indici di posizione, detti quantili e percentili, che dividono l’insieme di dati ordinati in un dato numero di parti uguali. Questi indici di posizione non centrale sono usati soprattutto per ampi insiemi di dati.
I quartili sono un caso particolare dei quantili, e si ottengono dividendo l’insieme di dati ordinati in quattro parti uguali.
Definizione
Il primo quartile Q1 è un valore tale che il 25 % dei dati ordinati è minore o uguale a Q1. Il primo quartile Q1 è detto anche 25-esimo percentile e indicato con P0,25.
Il terzo quartile Q3 è un valore tale che il 75 % dei dati ordinati è minore o uguale a Q3 ed è detto anche 75-esimo percentile e indicato con P0.75.
Il secondo quartile Q2 (50-esimo percentile) coincide con la mediana.
Per calcolare i quartili si segue una regola simile a quella usata per il calcolo della mediana.
Regola per il calcolo dei quartili
La regola può essere generalizzata in modo semplice per trovare un qualsiasi altro percentile.
1 − Si ordinano gli n dati assegnati in ordine crescente;
2 − si calcola il prodotto k = np , dove.p = 0,25 per il primo quartile e.p =0,75 per il terzo quartile;
3 − se k è un intero, il quartile si ottiene facendo la media del k-esimo e del (k+1)-esimo valore dei dati ordinati;
4 − se k non è intero, si arrotonda k per eccesso al primo intero successivo e si sceglie come quartile il corrispondente valore dei dati ordinati.
La regola può essere generalizzata in modo semplice per trovare un qualsiasi altro percentile.
Ad esempio per trovare il 95-esimo percentile, ossia quel valore tale che il 95 % dei dati ordinati è minore o uguale ad esso, si usa la stessa regola, con p = .0,95 (Molti software calcolano i percentili con una regola un po’ più complessa, basata sull’ interpolazione lineare fra dati adiacenti, perciò i valori trovati possono differire leggermente da quelli ricavati con la regola più semplice qui indicata).
Esempio
Calcolare il primo e il terzo quartile dell’insieme di dati
32.2 32.0 30.4 31.0 31.2 31.3 30.3 29.6 30.5 30.7
Dati ordinati
29.6 30.3 30.4 30.5 30.7 31.0 31.2 31.3 32.0 32.2
Primo quartile
n = 10 p = 0,25 k = np = 2,5
k non è intero, perciò si arrotonda per eccesso k= 3: il primo quartile è il terzo dei dati ordinati Q1 = 30.4.
Terzo quartile
n = 10 p = 0,75 k = np = 7,5
k non è intero, perciò si arrotonda per eccesso k = 8: il terzo quartile è l’ottavo dei dati ordinati Q3 = 31.3.
Secondo quartile (mediana)
n = 10 p = 0,75 k = np = 7,5
k è intero, perciò si fa la media tra il quinto e il sesto dato e si ottiene Q2 = (30,7 + 31)/2 = 30.85.
(Questo valore coincide con quello che si trova con la regola della mediana).
Esempio 2
Calcolare il primo e il terzo quartile e il 95-esimo percentile per i dati della tabella seguente:
Dati ordinati
Primo quartile
n = 80 p = 0,25 k = np = 20
k è intero, perciò si fa la media tra il 20-esimo e il 21-esimo dato e si ottiene
Q1 = (14,7 + 15,2)/2 = 14,95
Terzo quartile
n = 80 p = 0,75 k = np = 60
k è intero, perciò si fa la media tra il 60-esimo e il 61-esimo dato e si ottiene
Q3 = (22,9 + 23)/2 = 22,95
95-esimo percentile
n = 80 p = 0,95 k = np = 76
k è intero, perciò si fa la media tra il 76-esimo e il 77-esimo dato e si ottiene
P0,95 = (27,5 + 28,5)/2 = 28
Il 95-esimo percentile fornisce un’importante informazione: soltanto il 5% dei dati sono maggiori di 28.0, ossia, soltanto nel 5% dei giorni l’emissione di gas inquinanti supera la soglia di 28.0 unità.
(2375)