PRUEBAS  DE HIPÓTESIS
Estadística

PRUEBAS DE HIPÓTESIS

Si queremos decidir entre dos hipótesis que afectan a un cierto parámetro de la población, a partir de la información de la muestra usaremos el contraste de hipótesis, cuando optemos por una de estas dos hipótesis, hemos de conocer una medida del error cometido, es decir, cuantas veces de cada cien nos equivocamos.

En primer lugar, veremos cómo se escribirían las hipótesis que queremos contrastar:

  • H0 se llama hipótesis nula y es lo contrario de lo que sospechamos que va a ocurrir (suele llevar los signos igual, mayor o igual y menor o igual)

  • H1 se llama hipótesis alternativa y es lo que sospechamos que va a ser cierto (suele llevar los signos distinto, mayor y menor)

Los contrastes de hipótesis pueden ser de dos tipos:

  • Bilateral: En la hipótesis alternativa aparece el signo distinto.

  • Unilateral: En la hipótesis alternativa aparece o el signo > o el signo <.

Podemos aceptar una hipótesis cuando en realidad no es cierta, entonces cometeremos unos errores, que podrán ser de dos tipos:

  • Error de tipo I: Consiste en aceptar la hipótesis alternativa cuando la cierta es la nula.

  • Error de tipo II: Consiste en aceptar la hipótesis nula cuando la cierta es la alternativa.

Estos errores los aceptaremos si no son muy grandes o si no nos importa que sean muy grandes.

  • alfa: Es la probabilidad de cometer un error de tipo I.

  • beta: Es la probabilidad de cometer un error de tipo II.

De los dos, el más importante es alfa que llamaremos nivel de significación y nos informa de la probabilidad que tenemos de estar equivocados si aceptamos la hipótesis alternativa.

Debido a que los dos errores anteriores a la vez son imposibles de controlar, vamos a fijarnos solamente en el nivel de significación, este es el que nos interesa ya que la hipótesis alternativa que estamos interesados en probar y no queremos aceptarla si en realidad no es cierta, es decir, si aceptamos la hipótesis alternativa queremos equivocarnos con un margen de error muy pequeño.

El nivel de significación lo marcamos nosotros. Si es grande es más fácil aceptar la hipótesis alternativa cuando en realidad es falsa. El valor del nivel de significación suele ser un 5%, lo que significa que 5 de cada 100 veces aceptamos la hipótesis alternativa cuando la cierta es la nula.

Solamente vamos a estudiar el contraste bilateral para la media.


CONTRASTE DE HIPÓTESIS BILATERAL PARA LA MEDIA
Si se cumple una de las siguientes hipótesis:
  • El tamaño de la muestra es mayor de 30 y la variable sigue un modelo normal.

  • El tamaño de la muestra es mayor de 100.

Estudiaremos el siguiente contrate de hipótesis bilateral:

Calculamos los siguientes valores: 

  • , valor experimental que se calcula a partir de la muestra.

  • , valor teórico y es el valor que en la distribución N(0,1) deja a su derecha un área de alfa/2 para un nivel de significación alfa. Es el valor z que definíamos ala principio del tema.

La regla de decisión fijado el nivel de significación, alfa, es la siguiente:

  • Si   se acepta la hipótesis alternativa, llegamos a la conclusión de que la hipótesis es cierta.

  • Si se acepta la hipótesis nula, en realidad no podemos afirmar que sea cierta, sino que la hipótesis alternativa no es cierta, ya que el margen de error con el que se acepta la hipótesis nula es muy grande.

Actividad 21. Un equipo de psicólogos han comprobado que en cierta población infantil, el tiempo (en minutos) empleado en realizar determinada actividad manual, sigue un modelo Normal de probabilidad. Un grupo de 36 niños, seleccionados aleatoriamente en dicha población, realizaron esa actividad manual en un tiempo medio de 6,5 minutos con una desviación típica muestral de 1,5 minutos. A partir de esta información, para un nivel de significación del 1% (alfa=0,01) ¿podíamos rechazar la hipótesis de que el tiempo medio en la población es de 7 minutos? Utiliza la escena siguiente.

 

  

No podemos aceptar la hipótesis alternativa, y por lo tanto no podemos rechazar la hipótesis de que el tiempo medio en la población es de 7 minutos.

Actividad 22.  El gerente de una empresa selecciona aleatoriamente entre sus trabajadores una muestra de 169 y anota el número de horas de trabajo que cada uno de ellos ha perdido por causa de accidentes laborales en el año 2001. A partir de la información obtenida determina, en esos 169 trabajadores, un número medio de horas perdidas por accidentes laborales en el 2001 de 36,5 horas. Sabiendo que: 

donde representa el número de horas perdidas por el i-ésimo trabajador.

a)  ¿Podríamos rechazar, con un nivel de significación del 1% la hipótesis de que el número medio de horas perdidas a causa de accidentes laborales en esa empresa durante el año 2001 fue de 35 horas?

b) ¿Y para un nivel de significación del 5%?


Adaptación de María Vicenta Cabalgante Perera

de la unidad:

http://descartes.cnice.mecd.es/Bach_HCS_2/inferencia_estadistica/index_inferencia.htm

de: María José García Cebrian

© Ministerio de Educación y Ciencia. Año 2003