Test d’ipotesi

Il test d’ipotesi o test di significatività è il secondo grande metodo per eseguire inferenze statistiche relative a una popolazione.
Come un intervallo di confidenza per stimare un parametro, il test d’ipotesi impiega la probabilità per trovare un modo di quantificare quanto sia plausibile il valore di un parametro, controllando al tempo stesso la probabilità di eseguire una inferenza non corretta.

Ipotesi statistica

Un’ipotesi è una affermazione (assunzione) circa un parametro della popolazione. In genere nell’affermazione si dichiara che un parametro assume un particolare valore numerico, oppure che è compreso in un certo intervallo di valori:
• media della popolazione
Esempio:

Il tempo di vita medio di una tartaruga marina Caretta Caretta è di 40 anni, oppure il tempo di vita medio di una Caretta Caretta è compreso fra i 30 e i 60 anni..

• proporzione della popolazione
Esempio:

Nel Mediterraneo la proporzione di tartarughe marine tartarughe che muoiono dopo essere state catturate da attrezzi di pesca risulta p = 0.26.

L’ipotesi si riferisce sempre al parametro della popolazione e mai alla statistica campionaria.

Test d’ipotesi: esempio

Si vuole verificare se le lattine di caffè confezionate automaticamente da una ditta contengono in media il peso dichiarato µ = 250 g. A tale scopo si estrae un campione di 30 lattine, se ne pesa il contenuto e si calcola il peso medio, per stabilire se il peso medio differisce da 250g.

La verifica delle ipotesi statistiche inizia con la definizione del problema in termini di ipotesi sul parametro oggetto di studio.
Per prima cosa si stabilisce l’ipotesi da sottoporre a test, detta ipotesi nulla, indicata con H₀. Con l’ipotesi nulla si afferma che il parametro assume un particolare valore.

Oltre all’ipotesi nulla occorre specificare anche un’adeguata ipotesi alternativa, indicata con H_a, ossia un’affermazione che contraddice l’ipotesi nulla. Si afferma che il valore del parametro è uno tra quelli presenti in un certo intervallo di valori alternativi.

Si vuole verificare se le lattine di caffè confezionate automaticamente da una ditta contengono in media il peso dichiarato µ = 250 g. A tale scopo si estrae un campione di 30 lattine, se ne pesa il contenuto e si calcola il peso medio, per stabilire se il peso medio differisce da 250g.

Il tutto viene tradotto come:

• In un test d’ipotesi, si presume che l’ipotesi nulla sia vera a meno che i dati non producano forti evidenze contro di essa.
L’ipotesi nulla è posta con lo scopo di essere screditata, quindi ciò che si oppone alla conclusione che il ricercatore cerca di raggiungere rappresenta l’ipotesi nulla.
• Il ricercatore afferma che a essere vera è l’ipotesi alternativa. Nell’ipotesi alternativa viene messo ciò che si spera o ci si aspetta di poter concludere come risultato del test.
• Nell’ipotesi nulla deve sempre comparire un segno di uguaglianza (=, ≥ ,≤ ).
• Le due ipotesi sono complementari, ossia considerate insieme esauriscono tutte le possibilità riguardanti il valore che può assumere il parametro in esame.

Si può fare un’analogia con quanto avviene in un’aula di tribunale, quando una giuria deve decidere sulla colpevolezza o sull’innocenza di un imputato.
L’ipotesi nulla, che corrisponde all’assenza di un effetto, è che l’imputato sia innocente.
L’ipotesi alternativa è che l’imputato sia colpevole.

Ti potrebbe interessare anche: 15 cose che devi sapere sulla figura del programmatore!

La giuria considera l’imputato innocente a meno che chi l’accusa non produca una forte evidenza a favore della sua colpevolezza.
L’accusatore deve convincere la giuria che l’imputato sia colpevole.

ESEMPIO

Il contenuto dichiarato dal produttore delle bottiglie di acqua minerale di una certa marca è 920 ml. Un’associazione di consumatori sostiene che in realtà le bottiglie contengono in media una quantità inferiore di acqua.

In questo caso le ipotesi sono:

Le possibili conclusioni per un test di ipotesi sono:
1) se l’ipotesi nulla H₀ è rifiutata, si conclude che l’ipotesi alternativa H_a è probabilmente vera;
2) se l’ipotesi nulla non è rifiutata si conclude che i dati non forniscono una sufficiente evidenza per sostenere l’ipotesi alternativa.
E’ importante sottolineare che con la verifica delle ipotesi, e in generale con l’inferenza statistica, non si arriva alla dimostrazione di un’ipotesi; si ha solo un’indicazione del fatto che l’ipotesi sia o meno avvalorata dai dati disponibili.

Statistica test

Dopo aver formulato le ipotesi, occorre specificare quale risultato del campione porterà al rifiuto dell’ipotesi nulla.
Per poterlo fare si definisce una statistica test.

Il parametro al quale le ipotesi fanno riferimento, viene stimato puntualmente a partire dai dati. Una statistica test descrive quanto la stima puntuale si colloca lontano dal valore del parametro specificato nell’ ipotesi nulla. Può assumere tanti valori quanti sono i possibili campioni estraibili dalla popolazione.
In generale la distanza descritta dalla statistica test è misurata come numero di errori standard intercorrenti tra la stima puntuale e il parametro.

La distribuzione di campionamento della statistica test è, di solito, una distribuzione nota, come la distribuzione normale o la distribuzione t, e ricorriamo a queste distribuzioni per sottoporre a verifica un’ipotesi nulla.
Utilizzando le proprietà della distribuzione di campionamento della statistica soggetta a test, si può identificare un intervallo di valori di quella statistica che verosimilmente non si presentano se l’ipotesi nulla è vera.

La distribuzione di campionamento della statistica test è divisa in due regioni:
1) una regione di rifiuto che corrisponde all’insieme dei valori di una statistica test che conducono al rifiuto dell’ipotesi nulla;
2) una regione di accettazione che corrisponde all’insieme dei valori di una statistica test che portano invece all’ accettazione dell’ipotesi nulla.

Le due regioni sono, delimitate da uno o più valori, detti valori critici.
Se la statistica test, in base ai dati del campione, assume un valore che cade nella regione di rifiuto, l’ipotesi nulla deve essere rifiutata; se al contrario il valore cade nella regione di accettazione, l’ipotesi nulla non può essere rifiutata.

I test di ipotesi possono essere classificati in due gruppi:
1) test a una coda (o test unilaterale): la regione di rifiuto è costituita da un intervallo. per un test a una coda nell’ipotesi alternativa compare uno dei segni > oppure <.
2) test a due code (o test bilaterale): la regione di rifiuto è costituita da due intervalli, ossia da due code della distribuzione. Per un test a due code nell’ipotesi alternativa compare il segno =.

Significatività

Quando si applica un procedimento di verifica di ipotesi, si possono commettere due tipi di errori, l’errore di prima specie e l’errore di seconda specie.

Ti potrebbe interessare anche: I NUMERI INDICI : L'INDICE DI FISHER

L’errore di prima specie (detto anche livello di significatività) si verifica se si rifiuta l’ipotesi nulla quando è vera e quindi non dovrebbe essere rifiutata. La probabilità che si verifichi un errore di prima specie è indicata con α
L’errore di seconda specie si verifica se si accetta l’ipotesi nulla quando è falsa e quindi dovrebbe essere rifiutata. La probabilità che si verifichi un errore di seconda specie è indicata con β.

In genere, si controlla l’errore di prima specie fissando il livello del rischio α che si è disposti a tollerare.

Dal momento che il livello di significatività è specificato prima di condurre la verifica di ipotesi, il rischio di commettere un errore di prima specie
α è sotto il controllo di chi compie l’analisi (in genere i valori assegnati ad α sono 0.01, 0.05 o 0.1)
La scelta di α dipende fondamentalmente dai costi che derivano dal commettere un errore di prima specie Una volta specificato il valore di α, si ottiene anche la regione di rifiuto perché è la probabilità che la statistica test cada nella regione di rifiuto quando l’ipotesi nulla è vera. Il valore critico che separa la regione di accettazione da quella di rifiuto viene determinato di conseguenza.

Il coefficiente di confidenza, indicato con (1−α), rappresenta la probabilità che l’ipotesi nulla non sia rifiutata quando è vera (quindi non dovrebbe essere rifiutata). Il livello di confidenza di un test di ipotesi è dato da (1−α)×100%.

A differenza dell’errore di prima specie, che controlliamo fissando α, la probabilità di commettere un errore di seconda specie dipende dalla differenza tra il valore ipotizzato e il vero valore del parametro della popolazione: se la differenza è grande, è probabile che β sia piccolo.

La potenza del test, indicata con (1–β), rappresenta la probabilità di rifiutare l’ipotesi nulla quando è falsa (e quindi dovrebbe essere rifiutata).

Test di ipotesi Z per la media (σ noto)

Statistica Z per la verifica d’ipotesi sulla media (σ noto) — (1)

L’equazione (1) illustra come si ottiene la statistica test Z.
Il numeratore dell’equazione misura di quanto la media osservata differisce dalla media µ ipotizzata, mentre al denominatore troviamo l’errore standard della media. Pertanto Z ci dice per quanti errori standard X differisce da µ.

Per definire le regioni di accettazione e di rifiuto è necessario determinare i valori critici della statistica test, facendo riferimento alla distribuzione normale standardizzata una volta fissato l’errore di prima specie α.

Ad esempio, se si fissa α=0.05, l’area sottesa in corrispondenza della regione di rifiuto deve essere pari a 0.05. Poiché la regione di rifiuto coincide con le due code della distribuzione (si parla di un test a due code), l’area 0.05 viene divisa in due aree di 0.025. Una regione di rifiuto di 0.025 nelle due code della distribuzione normale dà luogo a un’area cumulata di 0.025 alla sinistra del valore critico più piccolo e a un’area pari a 0.975 alla sinistra del valore critico più grande.

Cercando queste aree nella tavola della distribuzione normale, troviamo che i valori critici che dividono la regione di rifiuto da quella di accettazione sono –1.96 e +1.96.

Ti potrebbe interessare anche: La regola di Cromwell

Esempio:

Ad esempio, potremmo asserire che un processo produttivo di riempimento delle scatole di cerali può essere considerato appropriato (sotto controllo) se il peso medio µ delle scatole è di 368 grammi.

L’ipotesi nulla in genere coincide con lo stato delle cose e viene indicata con il simbolo H₀, quindi nell’esempio del processo produttivo
H₀: µ = 368
Sebbene le informazioni siamo tratte a partire dal campione, l’ipotesi è espressa con riferimento a un parametro della popolazione, perché si è interessati all ’intero processo produttivo, vale a dire alla popolazione di tutte le scatole di cereali prodotte.
Se i risultati campionari non fossero favorevoli all’ipotesi nulla si dovrebbe concludere che l’ipotesi nulla sia falsa e chiaramente ci deve essere un’altra ipotesi che risulti vera.
L’ipotesi alternativa
H₁ è l’asserzione opposta all’ipotesi nulla, e nell’esempio in questione
H₁: µ ≠ 368

La logica sottostante alla verifica di ipotesi è quella di stabilire la plausibilità dell’ipotesi nulla alla luce delle informazioni campionarie
Se ipotesi nulla asserisce che il peso medio dei cereali contenuti in tutte le scatole prodotte è 368 grammi (il valore del parametro specificato dall’azienda) si procede all’estrazione di un campione di scatole e si pesa ciascuna scatola per calcolare la media campionaria (statistica che
stima il vero valore del parametro µ).
Anche se l’ipotesi nulla è vera, è probabile che la statistica differisca dal vero valore del parametro per effetto del caso o di un errore campionario.
Ciononostante ci aspettiamo che in questo caso la statistica campionaria sia vicina al parametro della popolazione.

La Figura mostra che se la media µ ha valore 368, come ipotizza H₀, allora la statistica test Z ha una distribuzione normale standardizzata. Valori di Z maggiori di +1.96 o minori di –1.96 indicano che X è così distante dal valore ipotizzato per µ (368) che non è probabile che questo valore si verifichi quando H₀ è vera.

Pertanto la regola decisionale è la seguente:

Rifiutare H₀ se Z<–1.96 oppure se Z>+1.96
Non rifiutare H₀ altrimenti

Supponiamo che la media campionaria calcolata a partire dal campione di 25 scatole sia 372.5 grammi e che σ sia 15 grammi, allora

e quindi non è possibile rifiutare l’ipotesi nulla.

Le 6 fasi della verifica di ipotesi utilizzando l’approccio del valore critico

1. Specificare l’ipotesi nulla e l’ipotesi alternativa
2. Scegliere il livello di significatività α e l’ampiezza campionaria n. Il livello di significatività viene fissato in base all’importanza relativa che si accorda ai rischi derivanti dal commettere un errore di prima specie e dal commettere un errore di seconda specie.
3. Individuare la tecnica statistica a cui fare riferimento e la corrispondente distribuzione campionaria.
4. Calcolare i valori critici che separano la regione di rifiuto da quella di accettazione.
5. Raccogliere i dati e calcolare il valore campionario della statistica test.
6. Prendere la decisione statistica. Se la statistica test cade nella regione di accettazione, l’ipotesi nulla H₀ non può essere rifiutata. Se la statistica test cade nella regione di rifiuto, l’ipotesi nulla H₀ viene rifiutata. Esprimere la decisione statistica con riferimento al problema che si sta affrontando.

[elementor-template id=”10808″]

[elementor-template id=”10688″]

(367)

Test d’ipotesi

Ultimi Articoli

Cerca nel sito

Test d’ipotesi

Ipotesi statistica

Statistica test

Significatività

Test di ipotesi Z per la media (σ noto)

Le 6 fasi della verifica di ipotesi utilizzando l’approccio del valore critico

Contact Us