Distribuciones
bidimensionales. Correlación y regresión
|
|
Estadística |
Dada una distribución bidimensional vamos a tratar de obtener una recta que se "adapte" lo mejor posible a la nube de puntos. Si obtenemos su ecuación podemos estimar o prever qué valor de y correspondería a un valor de x que se proponga.
La fiabilidad de la estimación dependerá de la magnitud del coeficiente de correlación ( fuerte o débil) y de la proximidad del valor de x a los valores de los datos.
9 En la ventana gráfica anterior se muestra la recta de regresión correspondiente a la siguiente distribución:
|
A |
B |
C |
D |
E |
F |
G |
H |
I |
J |
X |
2 |
3 |
4 |
5 |
6 |
6 |
7 |
7 |
8 |
10 |
Y |
1 |
3 |
2 |
4 |
4 |
6 |
4 |
6 |
7 |
9 |
Mueve los puntos con el ratón o modificando sus coordenadas con las líneas inferiores y observa cómo cambia la recta de regresión. En la parte superior hay un pulsador "mostrar". Si contiene un 1 mostrará los valores del índice de correlación y la ecuación de la recta de regresión. Comprueba cómo cambian los valores al modificar los puntos de la nube.
Para obtener esta recta se imponen dos condiciones:
Con esta condición se puede demostrar que la pendiente de la recta de regresión debe ser:
Por tanto la recta de regresión ( de y sobre x ) vendrá dada por :
En la siguiente ventana gráfica se muestra una distribución bidimensional y los valores necesarios para la obtención de la recta de regresión (medias, desviaciones típicas y covarianza). Si fijas a 1 el pulsador "mostrar" de la línea superior se mostrarán la recta de regresión, su ecuación, el valor del coeficiente de correlación y la estimación ( según la recta de regresión) del valor de y que correspondería a un valor de x dado. Para introducir este valor de x utiliza el pulsador correspondiente de la línea superior. Observa que si x= x entonces y=y.
10 Introduce en las líneas inferiores de la ventana gráfica anterior los datos correspondiente a las siguientes distribuciones bidimensionales. Anota en tu cuaderno las coordenadas del punto (x , y ) la pendiente de la recta de regresión y su ecuación. Obtén también la estimación de los valores de y que se solicita en cada caso.
a) Calificaciones de varios alumnos en dos asignaturas.
|
A |
B |
C |
D |
E |
F |
G |
H |
I |
J |
X
|
2 |
3 |
4 |
5 |
6 |
6 |
7 |
7 |
8 |
10 |
Y |
2 |
5 |
2 |
5 |
4 |
6 |
6 |
7 |
5 |
5 |
Si un alumno ha obtenido un 9 en X ¿qué nota podemos prever que obtenga en Y? ¿Y si x=4?
b) Distancia a la canasta y número de encestes.
|
A |
B |
C |
D |
E |
F |
G |
H |
I |
J |
X
|
1 |
2 |
2 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
Y |
9 |
10 |
6 |
4 |
2 |
0 |
1 |
1 |
1 |
0 |
Estima el número de encestes previsibles de sde una distancia de 3 metros y de 6 metros
c) Peso y estatura de 10 alumnos.
|
A |
B |
C |
D |
E |
F |
G |
H |
I |
J |
X
|
60 |
62 |
61 |
65 |
70 |
68 |
72 |
75 |
70 |
71 |
Y |
160 |
165 |
168 |
170 |
175 |
170 |
178 |
175 |
180 |
178 |
¿Qué estatura corresponde a pesos de 67 kg y de 80 kg?
NOTA: Para evitar problemas de escala toma un peso inicial 60. De esta forma podrás introducir 0,2,1,5... en vez de 60, 62, 61, 65... . Haz lo mismo con las tallas, tomando una talla inicial 160. Deberás modificar el punto (x , y ) resultante, pero piensa que las desviaciones y covarianza no se ven afectadas.
d) Temperaturas marcadas por dos termómetros en 10 días distintos
|
A |
B |
C |
D |
E |
F |
G |
H |
X |
10 | 12 | 15 | 20 | 25 | 22 | 18 | 30 |
Y |
50 | 53.6 | 59 | 68 | 77 | 71.6 | 64.4 | 86 |
Al hacer click en los pulsadores de la línea inferior, los valores se incrementan en 1. Utiliza el control "inc" de la línea superior para que el incremento se fije en una décima 0.1.
¿A cuántos grados Farenheit equivalen 16º y 28º Celsius? ¿Qué confianza te merecen las previsiones en este caso?
11 La siguiente ventana gráfica genera distribuciones aleatorias y muestra los valores necesarios para hallar la ecuación de la recta de regresión correspondiente. Cada vez que pulses el botón inicio o modifiques el número de puntos se generará una nueva distribución. Genera 4 distribuciones aleatorias, anota en el cuaderno de trabajo los valores auxiliares correspondientes y obtén a partir de ellos la ecuación de la recta de regresión. Si aparece un 1 en el control "mostrar" de la parte superior de la ventana se mostrará la ecuación pedida, pero debes hallarla por tu cuenta . Escribe también en el cuaderno de trabajo el coeficiente de correlación.
La condición de que la suma de los cuadrados de las diferencias (yi - yr )2 podría sustituirse por la de la suma de los cuadrados de las diferencias ( xi - xr )2 . En este caso obtendríamos la recta de regresión de x sobre y.
Si la correlación es fuerte las dos rectas apenas difieren.
Si en una distribución ( por ejemplo peso-talla ) permutamos el orden de las variables (talla-peso) la recta de regresión de y sobre x pasa a ser la de x sobre y y viceversa. No es razonable que difieran mucho. Si la correlación es débil la diferencia es apreciable pero en este caso (correlación débil) la fiabilidad de las previsiones que proporciona la recta de regresión es reducida. La recta que un observador trazaría "a ojo" entre la nube de puntos tiende a ser la bisectriz de las dos rectas de regresión.
En la siguiente ventana gráfica se muestran las dos rectas de regresión de una distribución bidimensional. Con el pulsador "mostrar" de la línea superior puedes visualizar la recta de y sobre x (1), de x sobre y (2) , la bisectriz (3), todas ellas (4) y ninguna(0). Modifica los puntos de la distribución y observa los resultados.
12 Introduce en la ventana gráfica anterior los datos de las distribuciones a, b, c, d, de la actividad 1 y anota en tu cuaderno de trabajo las ecuaciones de las dos rectas de regresión de cada caso.
Ver DISTRIBUCIONES BIDIMENSIONALES
Ver CORRELACIÓN
José Carlos Arias Rodrígez | ||
© Ministerio de Educación y Ciencia. Año 2004 | ||