test d’hipòtesis estadístiques

m
Matemàtiques

Donada una mostra de grandària n , ( x 1 ,...,x n ), formada per n realitzacions o observacions independents d’un cert fenomen o experiment.

Aquest mètode permet de decidir, a partir de les dades observades, si una hipòtesi estadística que hom ha fet sobre el model probabilístic del fenomen és correcta o no ho és. Aquesta decisió hauria d’ésser presa sempre amb un cert grau d’incertesa. Els problemes que tracta de resoldre aquesta teoria poden ésser, per exemple, decidir quin dels dos mètodes diferents de fabricació de bombetes elèctriques dóna una mida mitjana més gran, o bé saber, a partir d’una sèrie d’anàlisis, si un malalt té una certa malaltia. Sovint el model probabilístic consisteix en una llei de probabilitat teòrica donada per una funció de distribució F(x) —o bé per una funció de densitat f(x) —, i les hipòtesis són fetes sobre els valors de diferents paràmetres dels quals depèn aquesta llei. Si la hipòtesi consisteix a afirmar un valor determinat Θ 0 del paràmetre, és anomenada hipòtesi simple . La hipòtesi que hom fa sobre el model proposat és anomenada hipòtesi nul·la H 0 . En cas de rebutjar H 0 , la hipòtesi que hom accepta en el seu lloc és anomenada hipòtesi alternativa H 1 . Aleshores el test consisteix a fer una partició de l’espai mostral Ω —conjunt de valors possibles ( x 1 ,...,x n ) de la mostra— en dues regions complementàries W 1 (regió crítica) i W 2 (regió d’acceptació), i donar la següent regla de decisió: Si (x 1 ,...,x n ) pertany a W 1 , hom rebutja la hipòtesi H 0 . Si (x 1 ,...,x n ) pertany a W 2 hom accepta la hiòtesi H 0 . Cal fixar un nivell de significació α (sovint hom pren 0,01 o 0,05) que fiti la probabilitat de rebutja la hipòtesi nul·la quan és certa (probabilitat de l’error de primera espècie), és a dir, P(W i /H 0 ) ≤α. Hom defineix la potència del test com la probabilitat de rebutjar la hipòtesi nul·la que és falsa, és a dir, P(W i /H 1 ); el valor complementari P(W 2 /H 1 )=1- P(W i /H 1 ) serà la probabilitat d’acceptar H 0 quan aquesta hipòtesi és alsa o probabilitat de l’error de segona espècie. Per a construir un test de màxima potència entre dues hipòtesis simples H 0 :(Θ=Θ 1 ), i H 1 : (Θ=Θ 1 ), fixat un nivell de significació α, hi ha una tècnica general (donada l’any 1933 per J.Neyman i E.S.Pearson) basada en el quocient de les funcions de versemblança. Hom defineix la funció de versemblança per a un valor Θ del paràmetre com la densitat de probabilitat conjunta de la mostra, és a dir, L(x 1 ,...,x n / Θ)= f (x 1 /Θ)... f (x n /Θ). Aleshores el text té una regió crítica de la forma

on el valor c és pres d’una manera que W 1 doni el nivell de significació convingut: P(W 1 /H 0 )= α. En el cas d’hipòtesis múltiples, el test de la raó de versemblança consisteix a prendre un quocient de màxims de les funcions de versemblança, és a dir

Resultats sobre la distribució asimptòtica de l’estimador λ donen lloc a tècniques útils per al càlcul. Els test no paramètrics no suposen cap tipus de llei de probabilitat particular, i en aquest cas les hipòtesis es basen en detalls de la forma de les lleis. Com a exemple d’aquests tests poden ésser citats els tests d’ajust a un tipus específic de distribució de probabilitat, i en particular el test de normalitat (ajust a la llei normal), el test d’independència, el test dels signes i el test de les quantiles. Quan les dades són obtingudes d’una manera contínua, les tècniques de tests d’hipòtesis intenten de treure una decisió tan aviat com l’evidència sigui prou forta. En aquesta situació hom pot prendre a cada instant tres possibles decisions: ‘acceptar la hipòtesi Ho ', ‘acceptar la hipòtesi H 0 ' i ‘fer més observacions’. Aquesta és la base dels tests seqüencials , introduïts per A.Wald en el decenni dels anys quaranta.