Indice
Valori caratteristici di un insieme di dati
Oltre a media, x o µ, e deviazione standard, s o σ, esistono altri valori (puntuali) caratteristici di un insieme di dati e che forniscono ulteriori
informazioni sulla distribuzione dei dati (tendenza, centro, dispersione, asimmetrie).
• Moda (M0): valore che ha la massima occorrenza (o frequenza) nell’insieme di dati o valore più probabile. [è il picco della distribuzione di probabilità (ci sono anche distribuzioni bi- o multi-modali)]
• Mediana (Me): è una misura del centro del campione che divide i dati in due parti uguali (tanti dati al di sopra quanti al di sotto).
Se il numero di dati è pari, la mediana è a metà tra i due valori centrali; oppure, se dispari, la mediana coincide con il valore centrale.
[è il centro, tra le aree di sx e dx sotto la distribuzione di probabilità – punto a valore 0.5 nella cumulativa – (solo per distribuzioni simmetriche sta nel mezzo della dinamica e coincide con la media)]
• Dinamica (range): differenza tra il valore massimo e il valore minimo (è anche detta escursione da minimo a massimo o picco-picco).
Percentili e quartili
• k-esimo percentile: valore superiore al k% delle osservazioni e inferiore al (100-k)%.
• Primo quartile (quartile basso o di sx): valore tale che un quarto delle osservazioni abbia un valore inferiore; corrisponde al 25-esimo
percentile.
• Secondo quartile: valore tale che due quarti delle osservazioni abbiano un valore inferiore; corrisponde al 50-esimo percentile e alla mediana.
• Terzo quartile (quartile alto o di dx): valore tale che tre quarti delle osservazioni abbiano un valore inferiore; corrisponde al 75-esimo
percentile.
• Dinamica interquartile (DIQ): differenza tra il quartile superiore (terzo) e il quartile inferiore (primo); è la distanza tra i due quartili (1°e 3°).
Interpretazione dei valori caratteristici
Le percentuali sono riferite all’area sottesa alla curva (probabilità) o anche si possono vedere come frazione del totale dei valori.
Metodo di calcolo del k-esimo percentile
Consideriamo un campione di n dati ordinati in maniera crescente.
L’indice, di posizione, del k-esimo percentile è :
Dall’indice si ricava quindi il valore esatto con un’interpolazione lineare tra i due dati con indici pari all’intero prima e dopo di Ik%
Esempio 1:
n=14 dati xi.
Calcoliamo il 23-esimo percentile:
I23% = (14+1)×23 /100 = 3.45
Il valore del 23-esimo percentile sarà compreso tra il 3° ed il 4° dato (x3 e x4).
Numericamente poi
X23%= x3 + (x4 – x3) × 0.45 (interpolazione lineare)
Esempio 2:
n=78 dati xi.
Calcoliamo il 25-esimo percentile (1° quartile).
I25% = (78+1)×25 /100 = 19.75
Il valore del 25-esimo percentile sarà compreso tra il 19° ed il 20° dato (x19 e x20).
Numericamente poi:
X25%= x19 + (x20 – x19) × 0.75 (interpolazione lineare)
Calcolo dei quartili
Consideriamo ancora il campione di 80 dati (es. forza di compressione), in un diagramma a ramo-e-foglia ordinato.
L’indice del primo quartile Q1 vale:
I25% = (80+1)×25 /100 = 20.25
Dunque
Q1= x20 + (x21 –x20)× 0.25 == 143+(145-143) × 0.25 = 143.5
L’indice del secondo quartile Q2 vale:
I50% = (80+1) ×50 /100 = 40.5
Dunque Q2 è la media tra i due dati centrali (coincide con la mediana Q2 = 161.5).
L’indice del terzo quartile Q3 vale:
I75% = (80+1) ×75 /100 = 60.75
Dunque
Q3 = x60 + (x61 –x60) × 0.75 =
= 181+(181-181) × 0.75 = 181
(2126)