Test del Chi Quadro: Guida Pratica con Esercizi Risolti per Analisi Statistiche

Cerca nel sito

Altri risultati..

Generic selectors
Exact matches only
Search in title
Search in content
Post Type Selectors
Test del Chi Quadro Esercizi Pratici

Capire i dati che ci circondano è fondamentale. Spesso ci troviamo di fronte a domande come: “Le preferenze di un gruppo sono distribuite in modo uniforme?” oppure “Esiste una relazione tra due caratteristiche diverse?”. Il Test del Chi Quadro è uno strumento potente che ci permette di rispondere a queste domande con rigore statistico. In questa guida pratica, esploreremo come applicare questo test attraverso esempi concreti, partendo dalle basi per arrivare ad analisi più complesse. Ti guideremo passo dopo passo nella comprensione e nell’utilizzo di questo indispensabile strumento statistico.

Tabella del Chi quadro

Questi esercizi sono pensati per guidarti attraverso l’applicazione del test del Chi Quadro, partendo da concetti base fino ad analisi più complesse. Ogni esercizio include una spiegazione dettagliata passo-passo e richiami teorici per aiutarti a comprendere a fondo la materia.

Esercizio 1: Il Colore Preferito dei Nuovi Studenti

Testo dell’esercizio:

Un’università ha appena accolto una nuova coorte di studenti e vuole capire se le preferenze di colore per la nuova divisa sportiva (blu, rosso, verde) sono equamente distribuite o se c’è una preferenza significativa per un colore rispetto agli altri. Un sondaggio su 150 studenti ha rivelato le seguenti preferenze:

  • Blu: 60 studenti
  • Rosso: 45 studenti
  • Verde: 45 studenti

Utilizza il test del Chi Quadro per determinare se le preferenze di colore sono significativamente diverse da una distribuzione uniforme, con un livello di significatività (α) del 5%.

Soluzione:

Passo 1: Formulazione delle Ipotesi

Il primo passo in qualsiasi test di ipotesi è definire l’ipotesi nulla (H₀) e l’ipotesi alternativa (H₁).

  • Ipotesi Nulla (H₀): Le preferenze di colore sono equamente distribuite tra blu, rosso e verde. Questo significa che non c’è una preferenza significativa per nessun colore in particolare.
  • Ipotesi Alternativa (H₁): Le preferenze di colore non sono equamente distribuite. C’è una preferenza significativa per almeno un colore.

Passo 2: Calcolo delle Frequenze Attese (Eᵢ)

Se l’ipotesi nulla fosse vera, ci aspetteremmo che le preferenze siano uniformi. Dato un totale di 150 studenti e 3 colori, la frequenza attesa per ciascun colore sarebbe:

[math]\displaystyle E_i = \frac{\text{Totale studenti}}{\text{Numero di categorie}} = \frac{150}{3} = 50 \text{ studenti per colore.}[/math]

Quindi, le frequenze attese sono:

  • Blu: 50
  • Rosso: 50
  • Verde: 50

Passo 3: Calcolo della Statistica Test del Chi Quadro (χ²)

La formula per il calcolo del Chi Quadro è:

[math]\displaystyle \chi^2 = \sum \left[ \frac{(O_i – E_i)^2}{E_i} \right][/math]

Dove:

  • [math]O_i[/math] = Frequenza osservata per la categoria i
  • [math]E_i[/math] = Frequenza attesa per la categoria i

Applichiamo la formula per ciascun colore:

  • Blu: [math]\displaystyle \frac{(60 – 50)^2}{50} = \frac{10^2}{50} = \frac{100}{50} = 2[/math]
  • Rosso: [math]\displaystyle \frac{(45 – 50)^2}{50} = \frac{(-5)^2}{50} = \frac{25}{50} = 0.5[/math]
  • Verde: [math]\displaystyle \frac{(45 – 50)^2}{50} = \frac{(-5)^2}{50} = \frac{25}{50} = 0.5[/math]

Sommando questi valori otteniamo la statistica Chi Quadro:

[math]\displaystyle \chi^2 = 2 + 0.5 + 0.5 = 3[/math]

Passo 4: Determinazione dei Gradi di Libertà (df)

I gradi di libertà (df) indicano il numero di valori in un calcolo che sono liberi di variare. Per un test di adattamento (goodness-of-fit), la formula è:

Ti potrebbe interessare anche:  Il test t per dati appaiati

[math]\displaystyle \text{df} = \text{Numero di categorie} – 1[/math]

Nel nostro caso:

[math]\displaystyle \text{df} = 3 – 1 = 2[/math]

Passo 5: Determinazione del Valore Critico

Per prendere una decisione sull’ipotesi nulla, dobbiamo confrontare il nostro valore [math]\chi^2[/math] calcolato con un valore critico. Questo valore si trova nelle tabelle di distribuzione del Chi Quadro, utilizzando i gradi di libertà (df) e il livello di significatività (α).

Con [math]\text{df} = 2[/math] e [math]\alpha = 0.05[/math], consultando una tabella del Chi Quadro, troviamo un valore critico di 5.991.

Passo 6: Confronto e Conclusione

Confrontiamo il valore [math]\chi^2[/math] calcolato con il valore critico:

[math]\displaystyle \chi^2 \text{ calcolato } (3) < \text{Valore critico } (5.991)[/math]

Poiché il valore calcolato del Chi Quadro (3) è inferiore al valore critico (5.991), non abbiamo prove sufficienti per rifiutare l’ipotesi nulla. Questo significa che le differenze osservate nelle preferenze di colore sono probabilmente dovute al caso e non indicano una preferenza significativa per un colore specifico. In altre parole, le preferenze di colore degli studenti sono considerate equamente distribuite.

Osservazioni Strategiche:

  • Importanza delle Frequenze Attese: Il test del Chi Quadro si basa sul confronto tra ciò che osserviamo e ciò che ci aspetteremmo se l’ipotesi nulla fosse vera. Il calcolo accurato delle frequenze attese è fondamentale.
  • Gradi di Libertà: I gradi di libertà influenzano la forma della distribuzione del Chi Quadro e, di conseguenza, il valore critico. Un errore nel calcolo dei gradi di libertà porterebbe a una conclusione errata.
  • Livello di Significatività (α): Il livello di significatività (spesso 0.05 o 5%) rappresenta la probabilità di commettere un errore di Tipo I, ovvero rifiutare l’ipotesi nulla quando in realtà è vera. Un α più basso rende più difficile rifiutare l’ipotesi nulla.

Questo esercizio rappresenta un classico esempio di test di adattamento (goodness-of-fit). Dal punto di vista applicativo, è estremamente utile in scenari dove si vuole verificare se una distribuzione osservata di categorie si adatta a una distribuzione teorica predefinita (in questo caso, una distribuzione uniforme). Si pensi, ad esempio, alla verifica dell’equa distribuzione di clienti tra diversi punti vendita, o all’efficacia di un’urna elettorale nel garantire che ogni candidato riceva un numero di voti “atteso” se non ci fossero preferenze. È il primo passo per capire se i dati “si comportano” come ci aspetteremmo sotto un’ipotesi di assenza di effetto.

Peculiarità dell’esercizio: La sua peculiarità sta nella semplicità del modello atteso (distribuzione uniforme), che lo rende un ottimo punto di partenza per introdurre il concetto di frequenze attese e il calcolo della statistica Chi Quadro. È un esercizio molto intuitivo che dimostra come una piccola differenza tra osservato e atteso possa non essere statisticamente significativa, rafforzando il concetto che “caso” non significa “perfetta uguaglianza”. Sottolinea anche l’importanza del livello di significatività nel decidere se una differenza è degna di nota.

Esercizio 2: Indipendenza tra Genere e Preferenza di Genere Musicale

Testo dell’esercizio:

Un ricercatore sociale vuole indagare se esiste una relazione tra il genere (Maschio/Femmina) e la preferenza per un genere musicale specifico (Rock/Pop) tra gli studenti di una scuola superiore. Ha raccolto dati da un campione di 100 studenti, ottenendo la seguente tabella di contingenza:

Ti potrebbe interessare anche:  Esercizi svolti su test chi quadro e la legge di Mendel
Genere \ Genere Musicale Rock Pop Totale
Maschio 30 20 50
Femmina 15 35 50
Totale 45 55 100

Utilizza il test del Chi Quadro per verificare se esiste un’associazione significativa tra il genere e la preferenza musicale, con un livello di significatività (α) del 5%.

Soluzione:

Passo 1: Formulazione delle Ipotesi

  • Ipotesi Nulla (H₀): Il genere e la preferenza musicale sono indipendenti. Non esiste alcuna associazione tra le due variabili nella popolazione.
  • Ipotesi Alternativa (H₁): Il genere e la preferenza musicale non sono indipendenti. Esiste un’associazione significativa tra le due variabili nella popolazione.

Passo 2: Calcolo delle Frequenze Attese (Eᵢⱼ)

Per un test di indipendenza, le frequenze attese per ogni cella della tabella di contingenza si calcolano con la formula:

[math]\displaystyle E_{ij} = \frac{(\text{Totale riga i} \times \text{Totale colonna j})}{\text{Totale generale}}[/math]

Dove:

  • Totale riga i = Somma delle frequenze osservate nella riga i
  • Totale colonna j = Somma delle frequenze osservate nella colonna j
  • Totale generale = Somma di tutte le frequenze osservate

Calcoliamo le frequenze attese per ciascuna cella:

  • Maschio – Rock: [math]\displaystyle (50 \times 45) / 100 = 2250 / 100 = 22.5[/math]
  • Maschio – Pop: [math]\displaystyle (50 \times 55) / 100 = 2750 / 100 = 27.5[/math]
  • Femmina – Rock: [math]\displaystyle (50 \times 45) / 100 = 2250 / 100 = 22.5[/math]
  • Femmina – Pop: [math]\displaystyle (50 \times 55) / 100 = 2750 / 100 = 27.5[/math]

Tabella delle Frequenze Attese:

Genere \ Genere Musicale Rock Pop Totale
Maschio 22.5 27.5 50
Femmina 22.5 27.5 50
Totale 45 55 100

Passo 3: Calcolo della Statistica Test del Chi Quadro (χ²)

La formula rimane la stessa:

[math]\displaystyle \chi^2 = \sum \left[ \frac{(O_{ij} – E_{ij})^2}{E_{ij}} \right][/math]

Applichiamo la formula per ciascuna cella:

  • Maschio – Rock: [math]\displaystyle \frac{(30 – 22.5)^2}{22.5} = \frac{7.5^2}{22.5} = \frac{56.25}{22.5} = 2.5[/math]
  • Maschio – Pop: [math]\displaystyle \frac{(20 – 27.5)^2}{27.5} = \frac{(-7.5)^2}{27.5} = \frac{56.25}{27.5} \approx 2.045[/math]
  • Femmina – Rock: [math]\displaystyle \frac{(15 – 22.5)^2}{22.5} = \frac{(-7.5)^2}{22.5} = \frac{56.25}{22.5} = 2.5[/math]
  • Femmina – Pop: [math]\displaystyle \frac{(35 – 27.5)^2}{27.5} = \frac{7.5^2}{27.5} = \frac{56.25}{27.5} \approx 2.045[/math]

Sommando questi valori otteniamo la statistica Chi Quadro:

[math]\displaystyle \chi^2 = 2.5 + 2.045 + 2.5 + 2.045 = 9.09[/math]

Passo 4: Determinazione dei Gradi di Libertà (df)

Per un test di indipendenza in una tabella di contingenza, la formula per i gradi di libertà è:

[math]\displaystyle \text{df} = (\text{Numero di righe} – 1) \times (\text{Numero di colonne} – 1)[/math]

Nel nostro caso (2 righe e 2 colonne, escludendo i totali):

[math]\displaystyle \text{df} = (2 – 1) \times (2 – 1) = 1 \times 1 = 1[/math]

Passo 5: Determinazione del Valore Critico

Con [math]\text{df} = 1[/math] e [math]\alpha = 0.05[/math], consultando una tabella del Chi Quadro, troviamo un valore critico di 3.841.

Passo 6: Confronto e Conclusione

Confrontiamo il valore [math]\chi^2[/math] calcolato con il valore critico:

[math]\displaystyle \chi^2 \text{ calcolato } (9.09) > \text{Valore critico } (3.841)[/math]

Poiché il valore calcolato del Chi Quadro (9.09) è maggiore del valore critico (3.841), rifiutiamo l’ipotesi nulla. Questo significa che esiste un’associazione significativa tra il genere e la preferenza musicale. In altre parole, la preferenza musicale non è indipendente dal genere degli studenti.

Ti potrebbe interessare anche:  Statistica. Stimare l'attendibilità di un sondaggio e la numerosità minima del campione

Osservazioni Strategiche:

  • Tabelle di Contingenza: Sono lo strumento ideale per visualizzare la relazione tra due variabili categoriche. La loro struttura facilita il calcolo delle frequenze attese.
  • Indipendenza vs. Associazione: Il test del Chi Quadro ci dice se esiste un’associazione, ma non ci dice la forza o la direzione di tale associazione. Per questo, sarebbero necessarie altre misure (es. coefficiente di Cramer’s V).
  • Celle con Frequenze Attese Basse: È importante notare che il test del Chi Quadro è più affidabile quando le frequenze attese in ogni cella sono sufficientemente grandi (generalmente, si raccomanda che almeno l’80% delle celle abbia una frequenza attesa [math]\ge 5[/math]). Nel nostro caso, tutte le frequenze attese sono [math]\ge 5[/math], quindi il test è valido.

Questo esercizio illustra il test di indipendenza per variabili categoriche, un’applicazione molto comune del Test del Chi Quadro. È impiegato per determinare se esiste una relazione statistica tra due variabili categoriche, ovvero se la conoscenza dello stato di una variabile ci fornisce informazioni sullo stato dell’altra. A livello pratico, è usato in indagini di mercato (c’è un’associazione tra età e preferenza di prodotto?), in studi medici (c’è un’associazione tra fumo e sviluppo di una malattia?), o in scienze sociali (c’è un’associazione tra livello di istruzione e opinione politica?). Permette di andare oltre la semplice osservazione di frequenze e di stabilire se le deviazioni dall’indipendenza sono significative.

Peculiarità dell’esercizio: La peculiarità qui risiede nell’utilizzo della tabella di contingenza e nel calcolo delle frequenze attese basate sui totali di riga e colonna. Questo dimostra come il Test del Chi Quadro si adatti a strutture di dati più complesse rispetto al test di adattamento. L’esercizio evidenzia chiaramente come, anche con numeri apparentemente bilanciati (50/50 per genere), le distribuzioni incrociate (Maschio-Rock vs. Femmina-Rock) possano rivelare un’associazione significativa. Le “Osservazioni Strategiche” relative alle frequenze attese basse sono cruciali per la validità del test in scenari reali, aggiungendo un livello di professionalità all’analisi.

(344)

PubblicitàPubblicità