DISTRIBUCIÓN MUESTRAL DE PROPORCIONES

En una población se desea conocer la proporción p de individuos que poseen cierta característica.

A partir de la proporción de una muestra se puede estimar la proporción de toda la población. Si la muestra es aleatoria simple, la proporción muestral es un buen estimador puntual de la proporción de la población.

Se sabe, además, que la distribución de las proporciones muestrales se aproxima por una normal de media p y desviación típica, s, la raíz cuadrada de p(1-p)/n.


Actividad 1. En la siguiente escena p es la proporción de individuos de la población que poseen la característica "amarillo". Con los controles animar y tamaño comprueba si la proporción muestral es una "buena estimación" de la verdadera proporción p de toda la población (control Ver p). ¿Cómo varía la curva normal cuando el tamaño de la muestra, n, se hace más grande? ¿Por qué?

Actividad 2. Utilizando la tabla de la normal, halla la probabilidad de que la proporción muestral se encuentre entre dos valores concretos 0,3 y 0,4 por ejemplo. Halla a continuación, aumentando el número de muestras (control Num. de muestras y animar), qué porcentaje de proporciones se encuentran realmente entre 0,3 y 0,4.


Fijado un coeficiente de confianza, a, 0<a<1, La estimación de p mediante un intervalo de confianza consiste en calcular un intervalo de extremos aleatorios que contiene al verdadero valor del parámetro p con una probabilidad a. Siendo 1-a el nivel de riesgo.

Actividad 3. Comprueba con los controles Num. de muestras y Ver p que el porcentaje de intervalos de confianza que contienen a p es aproximadamente el nivel de confianza elegido (90, 95 o 99%)


Actividad 4. Observa que a medida que crece el tamaño de las muestra, n, disminuye la longitud de los intervalos de confianza, el error, por tanto, que cometemos al estimar p. Supongamos que queremos fijar, previamente, un error absoluto máximo de 0,1. Para un nivel de confianza del 95%, halla el tamaño de la muestra, tanto experimentalmente (aumentando n hasta que la longitud de los intervalos sea menor que 0,1) como teóricamente (despejando n de 0,05=1,96s, siendo s la raíz cuadrada de p(1-p)/n).



 

 

 

 Miguel Ángel García Rato
(c) Ministerio de Educación y Ciencia. Año 2002