El procedimiento mas objetivo para ajustar una recta a un conjunto de datos presentados en
un diagrama de dispersión se conoce como "el método de los mínimos cuadrados". La recta
resultante presenta dos características importantes:
1. Es nula la suma de las desviaciones verticales de los puntos a partir de la recta de ajuste
∑ (Yー - Y) = 0.
2. Es mínima la suma de los cuadrados de dichas desviaciones. Ninguna otra recta daría
una suma menor de las desviaciones elevadas al cuadrado ∑ (Yー - Y)² → 0
EJEMPLO 1
Se toma una muestra aleatoria de 8 ciudades de una región geográfica de 13 departamentos y se determina por los datos del censo el porcentaje de graduados en educación superior y la mediana del ingreso de cada ciudad, los resultados son los siguientes:
CIUDAD : 1 2 3 4 5 6 7 8
% de (X)
Graduados : 7.2 6.7 17.0 12.5 6.3 23.9 6.0 10.2
Ingreso (Y)
Mediana : 4.2 4.9 7.0 6.2 3.8 7.6 4.4 5.4 (0000)
Tenemos las ecuaciones normales
∑y = na + b∑x
∑xy = a∑x + b∑x²
Debemos encontrar los términos de las ecuaciones
∑y, ∑x, ∑xy, ∑ x² Por tanto procedemos de la siguiente forma:
Y | X | XY | X² |
4.2 | 7.2 | 30.24 | 51.84 |
4.9 | 6.7 | 32.83 | 44.89 |
7.0 | 17.0 | 119.00 | 289.00 |
6.2 | 12.5 | 77.50 | 156.25 |
3.8 | 6.3 | 23.94 | 39.69 |
7.6 | 23.9 | 181.64 | 571.21 |
4.4 | 6.0 | 26.40 | 36.00 |
5.4 | 10.2 | 55.08 | 104.04 |
43.5 | 89.8 | 546.63 | 1292.92 |