Esercizi svolti di preparazione all’esame di statistica

Cerca nel sito

Altri risultati..

Generic selectors
Exact matches only
Search in title
Search in content
Post Type Selectors
esercizi svolti di statistica


Indice

Esercizi svolti di preparazione all’esame di statistica II Parte

Esercizi svolti di preparazione all’esame di statistica III Parte

Esercizi svolti di preparazione all’esame di statistica IV Parte

Esercizi svolti di preparazione all’esame di statistica V Parte

Esercizi svolti di preparazione all’esame di statistica VI Parte

Trovi altri esercizi in fondo alla pagina


ESERCIZIO 1

La tabella seguente riporta la distribuzione di frequenza del numero di componenti rilevato su un collettivo di famiglie.


esercizi svolti di statistica

a) Qual è la frequenza relativa percentuale delle famiglie con 2 componenti?
b) Qual è la percentuale di famiglie con meno di 3 componenti?
c) Qual è la percentuale di famiglie con almeno 4 componenti?
Esprimere tutti i risultati in termini percentuali. Tolleranza massima ± 0.1.

SOLUZIONE

a) Fi = ni/n = [1025 / (966+1025+845+726+243+97)] * 100 = (1025/3902) * 100 = 26,27

b) Fi = ni/n = [(966+1025) / (966+1025+845+726+243+97)] * 100 = (1991/3902) * 100 = 51,03

c) Fi = ni/n = [(726+243+97) / (966+1025+845+726+243+97)] * 100 = (1066/3902) * 100 = 27,32

ESERCIZIO 2

Nella tabella seguente è riportata la distribuzione percentuale di frequenza del gruppo sanguigno in un collettivo di 1488 persone.

esercizi svolti di statistica

a) Perché non è possibile costruire la distribuzione di frequenza cumulata?
b) Quanti soggetti hanno gruppo sanguigno A (tolleranza massima 1)?

SOLUZIONE
a) Perché il carattere non è ordinabile.

b) 1488 * 0,3629 = 540

ESERCIZIO 3

La Banca d’Italia conduce con cadenza biennale l’Indagine sui bilanci delle famiglie. Tra le altre cose, viene chiesto al capofamiglia se il reddito familiare consente di arrivare alla fine del mese:

con molta difficoltà con difficoltà
con qualche difficoltà
abbastanza facilmente
facilmente
molto facilmente

La tabella seguente riporta le risposte fornite da 27 famiglie.

Scegliere l’indice di posizione più opportuno per rappresentare il fenomeno e indicarne il valore.

SOLUZIONE

L’indice è la mediana e il valore è “con qualche difficoltà”, perché ci sono:
con molta difficoltà = 5
con difficoltà = 4
con qualche difficoltà = 9
abbastanza facilmente = 5
facilmente = 3
molto facilmente = 1
La mediana di 27 è (27-1)/2 = 13, il tredicesimo valore in ordine è nel campo “con qualche difficoltà”.

ESERCIZIO 4

La tabella seguente riporta la distribuzione di frequenza percentuale dei voti all’esame di statistica per un collettivo di studenti.

Scegliere l’indice di posizione più opportuno per rappresentare il fenomeno e indicarne il valore (tolleranza massima di ± 0.1).

SOLUZIONE

Indice di posizione: media aritmetica
Valore: (18*8,3 + 19*3,6 + 20*7,6 + … + 30*4,5) / 100 = 23,7

ESERCIZIO 5

La tabella seguente riporta la distribuzione di frequenza percentuale del settore di attività economica rilevato su un insieme di 1085 occupati.

Scegliere l’indice di posizione più opportuno per rappresentare il fenomeno e indicarne il valore.

SOLUZIONE

L’indice più opportuno è la moda e il valore della moda è “industria” in quanto è il settore con più occupati tra i 1085.

Ti potrebbe interessare anche:  Python: Numpy. Creare array random

ESERCIZIO 6

La tabella seguente riporta il costo medio per prescrizione farmaceutica a carico del SSN ed il numero di prescrizioni in un anno.

a) Calcolare il costo medio totale
b) Calcolare il costo medio totale a carico del SSN se su ogni prescrizione viene imposto un ticket di 2 euro
c) Calcolare il costo medio totale a carico del SSN ipotizzando che la Regione Lombardia e la Regione Toscana applichino un ticket di 2 euro a prescrizione, la Regione Liguria un ticket pari al 10% del costo della prescrizione e la Regione Campania non intervenga

Tolleranza massima ± 0.1.

SOLUZIONE

a) Calcolare il costo medio totale:
(24,1*76101411 + 31,1*11033339 + 22,4*27319851 + 19,7*27665946) / (76101411 + … + 27665946) = 23,5
b) Calcolare il costo medio totale a carico del SSN se su ogni prescrizione viene imposto un ticket di 2 euro: 23,5 – 2 = 21,5
c) Calcolare il costo medio totale a carico del SSN ipotizzando che la Regione Lombardia e la Regione Toscana applichino un ticket di 2 euro a prescrizione, la Regione Liguria un ticket pari al 10% del costo della prescrizione e la Regione Campania non intervenga:
(22,1*76101411 + 27,99*11033339 + 20,4*27319851 + 19,7*27665946) / (76101411 + … + 27665946) = 23,5 = 21,76

ESERCIZIO 7

Nella tabella seguente è riportata la distribuzione di frequenza percentuale del numero di componenti del nucleo familiare rilevata su 1814 famiglie.

Calcolare la mediana della distribuzione.

SOLUZIONE

La mediana della distribuzione è il valore 3, infatti la mediana su una distribuzione di frequenza si trova con il valore che si ha superato il 50%.

ESERCIZIO 8

Nella tabella seguente sono riportate le variazioni percentuali del prezzo di un bene nel decennio 2001-2010.

Calcolare una media delle variazioni che lasci inalterata la variazione complessiva sul periodo considerato (tolleranza massima ± 0.1)

SOLUZIONE

(3,5 + 1,7 + … + 3,1 + 2,1) / 10 = 2,92

ESERCIZIO 9

Nella tabella seguente è riportato il punteggio conseguito da 12 candidati ad un test attitudinale.

Calcolare la varianza e lo scarto quadratico medio dei punteggi (tolleranza massima ± 0.1).

SOLUZIONE

x (media) = (73+86+99+93+76+63+84+95+71+100+82+94)/12=1016/12=84,67
Calcolo la varianza e subito dopo lo scarto quadratico medio, facendo la radice quadrata della varianza:

σ² = [(73-84,67)²+(86-84,67)²+…+(94-84,67)²]/12=1580,68/12 = 131,72
σ= √σ² = √131,72 = 11,48

ESERCIZIO 10

Nel corso dell’ultimo anno il titolo A ha avuto un prezzo di mercato medio pari a 2.66 e una varianza pari a 1.54. Sempre nello stesso periodo il titolo B ha avuto un prezzo medio pari a 4.41 e una varianza pari a 2.8.
Indicare quale indice è più opportuno per confrontare la volatilità (variabilità) dei due titoli ed indicare quello con maggiore volatilità.

Ti potrebbe interessare anche:  Le combinazioni semplici

SOLUZIONE

Coefficiente di variazione

Il titolo A

Cosè il coefficiente di variazione

l coefficiente di variazione (CV) è una misura della variabilità relativa. È il rapporto tra la deviazione standard e la media (media).

Per esempio, l’espressione “La deviazione standard è il 15% della media” è un CV.

Il CV è particolarmente utile quando si vogliono confrontare i risultati di due diversi sondaggi o test che hanno misure o valori diversi.

Ad esempio, se si confrontano i risultati di due test che hanno meccanismi di punteggio diversi. Se il campione A ha un CV del 12% e il campione B ha un CV del 25%, si direbbe che il campione B ha una variazione maggiore, rispetto alla sua media.

Formula del coefficiente di variazione

La formula per il coefficiente di variazione è:

Coefficiente di variazione = (Deviazione standard / media) * 100.

ESERCIZIO 11

La tabella seguente riporta la distribuzione dello stato civile rilevato su un collettivo di individui.

Misurare il grado di eterogeneità della distribuzione (tolleranza massima ± 0.01).

SOLUZIONE

𝐸𝐺= 1 − ∑𝐹𝑖2 =1-0,43 = 0,57

(formula indice di eterogeneità di Gini)

Esercizi svolti riepilogativi sugli indici di variabilità e sull’ indice di Eterogeneità di Gini

ESERCIZIO 12

La tabella che segue riporta i risultati di uno studio volto a valutare se c’è indipendenza statistica tra età e mezzo di informazione preferito.

Indicare quale indice utilizzeresti per tale valutazione e calcolarne il valore (tolleranza massima ± 0.01)

SOLUZIONE

L’indice da utilizzare per questa valutazione è l’indice V di Cramer perché è normalizzato. Ricreo la tabella in modo da poter fare le somme di righe e colonne.

Cos’è indice V di Cramer (clicca qui)

Creo la tabella delle frequenze attese, la cui formula è:

tabella delle frequenze attese la formula

Esempio primi calcoli (prima e seconda riga dei numeri):

(166*158)/548 = 47,86 (166*195)/548 = 59,07 (166*195)/548 = 59,07
(90*158)/548 = 25,95 (90*195)/548 = 32,03 (90*195)/548 = 32,03

Creo la tabella delle contingenze, la cui formula è:

e le somme di righe e colonne in questa tabella devono essere uguali a zero.
Esempio primi calcoli (prima e seconda riga dei numeri):

36-47,86 = -11,86 54-59,07 = -5,07 76-59,07 = 16,93
24-25,95 = -1,95 31-32,03 = -1,03 35-32,03 = 2,97

tabella delle contingenze

Adesso è possibile creare la tabella con i risultati che provengono dalla formula:

Esempio primi calcoli (prima e seconda riga dei numeri):

(-11,86)2/47,86 = 2,94    (-5,07)2/59,07 = 0,44   (-16,93)2/59,07= 4,85
(-1,95)2/25,95 = 20,15    (-1,03)2/32,03 = 0,03   (2,97)2/32,03 = 0,09

Calcolo il chi quadrato, sommando tutte le celle numeriche di quest’ultima tabelle:

Trovo la contingenza quadratica media, con la formula:

E posso trovare l’indice V di Cramer, mettendo a denominatore il numero che è il minimo tra le righe e le colonne meno uno, in questo caso (contando solamente i valori numerici della tabella) abbiamo tre colonne e quattro righe, quindi scelgo il numero tre delle colonne meno uno, che fa due, ed è il due da mettere a denominatore.

Ti potrebbe interessare anche:  Logica induttiva e calcolo delle probabilità

indice V di Cramer

ESERCIZIO 13

La tabella che segue riporta la distribuzione per reddito e condizione professionale del capofamiglia per un collettivo di famiglie.

Indicare quale indice utilizzeresti per valutare se il reddito dipende dalla condizione professionale e calcolarne il valore (tolleranza massima ±0.01)

SOLUZIONE

Utilizzo il rapporto di correlazione.
Per prima cosa si inverte la tabella, e le fasce di reddito le sostituisco dai numeri 1 fino a 6; le celle colorate indicano le somme.

Media marginale:

media marginale

Medie condizionate di D, A, P:

medie condizionate

Varianza totale:

varianza totale

Varianza delle medie condizionate:

E dopo questi passaggi posso trovare il rapporto di correlazione:

rapporto di correlazione

ESERCIZIO 14

La tabella che segue riporta i risultati di uno studio volto a studiare la variabilità sul territorio nazionale degli canoni di locazione residenziale (espressi in migliaia di euro).

Indicare quale indice utilizzeresti per valutare se il canone annuale dipende dalla ripartizione geografica e calcolarne il valore (tolleranza massima ± 0.01).

SOLUZIONE

Utilizzo il rapporto di correlazione.

Come prima cosa aggiungo la varianza σ2, elevando alla seconda la deviazione standard σ, creando la colonna in viola. Dopodiché faccio la somma dei numeri e la media delle medie, che mi serviranno in seguito.

Calcolo la media delle varianze condizionate:

Calcolo la varianza delle medie condizionate:

Trovo la varianza totale sommando i due risultati trovati

𝜎𝑦2= 11,07+ 1,58= 12,65

così posso risolvere l’esercizio trovando il rapporto di correlazione:

ESERCIZIO 15

Ad un insieme di consumatori è stato chiesto di valutare un prodotto acquistato on-line, assegnando un punteggio da 1 a 10 ai due attributi “Qualità del prodotto” e “Tempo di consegna”. I valori osservati su 12 consumatori sono riportati nella tabella seguente.
La tabella che segue riporta la valutazione espressa da 12 consumatori.

 

 

Calcolare il coefficiente di correlazione lineare (tolleranza massima ± 0.01)

SOLUZIONE

Prima calcolo le medie di Q e T:
Qmedia = (6+3+5+…+6)/12 = 66/12 = 5,5
Tmedia = (8+6+6+…+8)/12 = 89/12 = 7,42
Poi aggiungo la colonna colorata, che moltiplica i valori Q*T, e calcolo quindi la somma dei Q*T, per semplificare il calcolo successivo:

Calcolo la covarianza:
COV(x,y) = 42,25-(5,5*7,42) = 1,44
Calcolo lo scarto quadratico medio di Q e di T:

Ed infine posso calcolare il coefficiente di correlazione lineare ρ:

Cos’è il coefficiente di correlazione lineare?

Esercizi svolti di preparazione all’esame di statistica (II Parte)

[elementor-template id=”10808″]

[elementor-template id=”11862″]

 

 

 

 

(11365)