Indice
Esercizi svolti di preparazione all’esame di statistica II Parte
Esercizi svolti di preparazione all’esame di statistica III Parte
Esercizi svolti di preparazione all’esame di statistica IV Parte
Esercizi svolti di preparazione all’esame di statistica V Parte
Esercizi svolti di preparazione all’esame di statistica VI Parte
Trovi altri esercizi in fondo alla pagina
ESERCIZIO 1
La tabella seguente riporta la distribuzione di frequenza del numero di componenti rilevato su un collettivo di famiglie.
a) Qual è la frequenza relativa percentuale delle famiglie con 2 componenti?
b) Qual è la percentuale di famiglie con meno di 3 componenti?
c) Qual è la percentuale di famiglie con almeno 4 componenti?
Esprimere tutti i risultati in termini percentuali. Tolleranza massima ± 0.1.
SOLUZIONE
a) Fi = ni/n = [1025 / (966+1025+845+726+243+97)] * 100 = (1025/3902) * 100 = 26,27
b) Fi = ni/n = [(966+1025) / (966+1025+845+726+243+97)] * 100 = (1991/3902) * 100 = 51,03
c) Fi = ni/n = [(726+243+97) / (966+1025+845+726+243+97)] * 100 = (1066/3902) * 100 = 27,32
ESERCIZIO 2
Nella tabella seguente è riportata la distribuzione percentuale di frequenza del gruppo sanguigno in un collettivo di 1488 persone.
a) Perché non è possibile costruire la distribuzione di frequenza cumulata?
b) Quanti soggetti hanno gruppo sanguigno A (tolleranza massima 1)?
SOLUZIONE
a) Perché il carattere non è ordinabile.
b) 1488 * 0,3629 = 540
ESERCIZIO 3
La Banca d’Italia conduce con cadenza biennale l’Indagine sui bilanci delle famiglie. Tra le altre cose, viene chiesto al capofamiglia se il reddito familiare consente di arrivare alla fine del mese:
con molta difficoltà con difficoltà
con qualche difficoltà
abbastanza facilmente
facilmente
molto facilmente
La tabella seguente riporta le risposte fornite da 27 famiglie.
Scegliere l’indice di posizione più opportuno per rappresentare il fenomeno e indicarne il valore.
SOLUZIONE
L’indice è la mediana e il valore è “con qualche difficoltà”, perché ci sono:
con molta difficoltà = 5
con difficoltà = 4
con qualche difficoltà = 9
abbastanza facilmente = 5
facilmente = 3
molto facilmente = 1
La mediana di 27 è (27-1)/2 = 13, il tredicesimo valore in ordine è nel campo “con qualche difficoltà”.
ESERCIZIO 4
La tabella seguente riporta la distribuzione di frequenza percentuale dei voti all’esame di statistica per un collettivo di studenti.
Scegliere l’indice di posizione più opportuno per rappresentare il fenomeno e indicarne il valore (tolleranza massima di ± 0.1).
SOLUZIONE
Indice di posizione: media aritmetica
Valore: (18*8,3 + 19*3,6 + 20*7,6 + … + 30*4,5) / 100 = 23,7
ESERCIZIO 5
La tabella seguente riporta la distribuzione di frequenza percentuale del settore di attività economica rilevato su un insieme di 1085 occupati.
Scegliere l’indice di posizione più opportuno per rappresentare il fenomeno e indicarne il valore.
SOLUZIONE
L’indice più opportuno è la moda e il valore della moda è “industria” in quanto è il settore con più occupati tra i 1085.
ESERCIZIO 6
La tabella seguente riporta il costo medio per prescrizione farmaceutica a carico del SSN ed il numero di prescrizioni in un anno.
a) Calcolare il costo medio totale
b) Calcolare il costo medio totale a carico del SSN se su ogni prescrizione viene imposto un ticket di 2 euro
c) Calcolare il costo medio totale a carico del SSN ipotizzando che la Regione Lombardia e la Regione Toscana applichino un ticket di 2 euro a prescrizione, la Regione Liguria un ticket pari al 10% del costo della prescrizione e la Regione Campania non intervenga
Tolleranza massima ± 0.1.
SOLUZIONE
a) Calcolare il costo medio totale:
(24,1*76101411 + 31,1*11033339 + 22,4*27319851 + 19,7*27665946) / (76101411 + … + 27665946) = 23,5
b) Calcolare il costo medio totale a carico del SSN se su ogni prescrizione viene imposto un ticket di 2 euro: 23,5 – 2 = 21,5
c) Calcolare il costo medio totale a carico del SSN ipotizzando che la Regione Lombardia e la Regione Toscana applichino un ticket di 2 euro a prescrizione, la Regione Liguria un ticket pari al 10% del costo della prescrizione e la Regione Campania non intervenga:
(22,1*76101411 + 27,99*11033339 + 20,4*27319851 + 19,7*27665946) / (76101411 + … + 27665946) = 23,5 = 21,76
ESERCIZIO 7
Nella tabella seguente è riportata la distribuzione di frequenza percentuale del numero di componenti del nucleo familiare rilevata su 1814 famiglie.
Calcolare la mediana della distribuzione.
SOLUZIONE
La mediana della distribuzione è il valore 3, infatti la mediana su una distribuzione di frequenza si trova con il valore che si ha superato il 50%.
ESERCIZIO 8
Nella tabella seguente sono riportate le variazioni percentuali del prezzo di un bene nel decennio 2001-2010.
Calcolare una media delle variazioni che lasci inalterata la variazione complessiva sul periodo considerato (tolleranza massima ± 0.1)
SOLUZIONE
(3,5 + 1,7 + … + 3,1 + 2,1) / 10 = 2,92
ESERCIZIO 9
Nella tabella seguente è riportato il punteggio conseguito da 12 candidati ad un test attitudinale.
Calcolare la varianza e lo scarto quadratico medio dei punteggi (tolleranza massima ± 0.1).
SOLUZIONE
x (media) = (73+86+99+93+76+63+84+95+71+100+82+94)/12=1016/12=84,67
Calcolo la varianza e subito dopo lo scarto quadratico medio, facendo la radice quadrata della varianza:
σ² = [(73-84,67)²+(86-84,67)²+…+(94-84,67)²]/12=1580,68/12 = 131,72
σ= √σ² = √131,72 = 11,48
ESERCIZIO 10
Nel corso dell’ultimo anno il titolo A ha avuto un prezzo di mercato medio pari a 2.66 e una varianza pari a 1.54. Sempre nello stesso periodo il titolo B ha avuto un prezzo medio pari a 4.41 e una varianza pari a 2.8.
Indicare quale indice è più opportuno per confrontare la volatilità (variabilità) dei due titoli ed indicare quello con maggiore volatilità.
SOLUZIONE
Coefficiente di variazione
Il titolo A
Cosè il coefficiente di variazione
l coefficiente di variazione (CV) è una misura della variabilità relativa. È il rapporto tra la deviazione standard e la media (media).
Per esempio, l’espressione “La deviazione standard è il 15% della media” è un CV.
Il CV è particolarmente utile quando si vogliono confrontare i risultati di due diversi sondaggi o test che hanno misure o valori diversi.
Ad esempio, se si confrontano i risultati di due test che hanno meccanismi di punteggio diversi. Se il campione A ha un CV del 12% e il campione B ha un CV del 25%, si direbbe che il campione B ha una variazione maggiore, rispetto alla sua media.
Formula del coefficiente di variazione
La formula per il coefficiente di variazione è:
Coefficiente di variazione = (Deviazione standard / media) * 100.
ESERCIZIO 11
La tabella seguente riporta la distribuzione dello stato civile rilevato su un collettivo di individui.
Misurare il grado di eterogeneità della distribuzione (tolleranza massima ± 0.01).
SOLUZIONE
𝐸𝐺= 1 − ∑𝐹𝑖2 =1-0,43 = 0,57
(formula indice di eterogeneità di Gini)
Esercizi svolti riepilogativi sugli indici di variabilità e sull’ indice di Eterogeneità di Gini
ESERCIZIO 12
La tabella che segue riporta i risultati di uno studio volto a valutare se c’è indipendenza statistica tra età e mezzo di informazione preferito.
Indicare quale indice utilizzeresti per tale valutazione e calcolarne il valore (tolleranza massima ± 0.01)
SOLUZIONE
L’indice da utilizzare per questa valutazione è l’indice V di Cramer perché è normalizzato. Ricreo la tabella in modo da poter fare le somme di righe e colonne.
Cos’è indice V di Cramer (clicca qui)
Creo la tabella delle frequenze attese, la cui formula è:
Esempio primi calcoli (prima e seconda riga dei numeri):
(166*158)/548 = 47,86 (166*195)/548 = 59,07 (166*195)/548 = 59,07
(90*158)/548 = 25,95 (90*195)/548 = 32,03 (90*195)/548 = 32,03
Creo la tabella delle contingenze, la cui formula è:
e le somme di righe e colonne in questa tabella devono essere uguali a zero.
Esempio primi calcoli (prima e seconda riga dei numeri):
36-47,86 = -11,86 54-59,07 = -5,07 76-59,07 = 16,93
24-25,95 = -1,95 31-32,03 = -1,03 35-32,03 = 2,97
Adesso è possibile creare la tabella con i risultati che provengono dalla formula:
Esempio primi calcoli (prima e seconda riga dei numeri):
(-11,86)2/47,86 = 2,94 (-5,07)2/59,07 = 0,44 (-16,93)2/59,07= 4,85
(-1,95)2/25,95 = 20,15 (-1,03)2/32,03 = 0,03 (2,97)2/32,03 = 0,09
Calcolo il chi quadrato, sommando tutte le celle numeriche di quest’ultima tabelle:
Trovo la contingenza quadratica media, con la formula:
E posso trovare l’indice V di Cramer, mettendo a denominatore il numero che è il minimo tra le righe e le colonne meno uno, in questo caso (contando solamente i valori numerici della tabella) abbiamo tre colonne e quattro righe, quindi scelgo il numero tre delle colonne meno uno, che fa due, ed è il due da mettere a denominatore.
ESERCIZIO 13
La tabella che segue riporta la distribuzione per reddito e condizione professionale del capofamiglia per un collettivo di famiglie.
Indicare quale indice utilizzeresti per valutare se il reddito dipende dalla condizione professionale e calcolarne il valore (tolleranza massima ±0.01)
SOLUZIONE
Utilizzo il rapporto di correlazione.
Per prima cosa si inverte la tabella, e le fasce di reddito le sostituisco dai numeri 1 fino a 6; le celle colorate indicano le somme.
Media marginale:
Medie condizionate di D, A, P:
Varianza totale:
Varianza delle medie condizionate:
E dopo questi passaggi posso trovare il rapporto di correlazione:
ESERCIZIO 14
La tabella che segue riporta i risultati di uno studio volto a studiare la variabilità sul territorio nazionale degli canoni di locazione residenziale (espressi in migliaia di euro).
Indicare quale indice utilizzeresti per valutare se il canone annuale dipende dalla ripartizione geografica e calcolarne il valore (tolleranza massima ± 0.01).
SOLUZIONE
Utilizzo il rapporto di correlazione.
Come prima cosa aggiungo la varianza σ2, elevando alla seconda la deviazione standard σ, creando la colonna in viola. Dopodiché faccio la somma dei numeri e la media delle medie, che mi serviranno in seguito.
Calcolo la media delle varianze condizionate:
Calcolo la varianza delle medie condizionate:
Trovo la varianza totale sommando i due risultati trovati
𝜎𝑦2= 11,07+ 1,58= 12,65
così posso risolvere l’esercizio trovando il rapporto di correlazione:
ESERCIZIO 15
Ad un insieme di consumatori è stato chiesto di valutare un prodotto acquistato on-line, assegnando un punteggio da 1 a 10 ai due attributi “Qualità del prodotto” e “Tempo di consegna”. I valori osservati su 12 consumatori sono riportati nella tabella seguente.
La tabella che segue riporta la valutazione espressa da 12 consumatori.
Calcolare il coefficiente di correlazione lineare (tolleranza massima ± 0.01)
SOLUZIONE
Prima calcolo le medie di Q e T:
Qmedia = (6+3+5+…+6)/12 = 66/12 = 5,5
Tmedia = (8+6+6+…+8)/12 = 89/12 = 7,42
Poi aggiungo la colonna colorata, che moltiplica i valori Q*T, e calcolo quindi la somma dei Q*T, per semplificare il calcolo successivo:
Calcolo la covarianza:
COV(x,y) = 42,25-(5,5*7,42) = 1,44
Calcolo lo scarto quadratico medio di Q e di T:
Ed infine posso calcolare il coefficiente di correlazione lineare ρ:
Cos’è il coefficiente di correlazione lineare?
Esercizi svolti di preparazione all’esame di statistica (II Parte)
[elementor-template id=”10808″]
[elementor-template id=”11862″]
(11365)