viernes, 29 de julio de 2016

Medidas de dispersión

Medidas de dispersión 

Las medidas de dispersión, también llamadas medidas de variabilidad, muestran la variabilidad de una distribución, indicando por medio de un número, si las diferentes puntuaciones de una variable están muy alejadas de la media. Así se sabe si todos los casos son parecidos o varían mucho entre ellos.

El rango o recorrido estadístico es la diferencia entre el valor máximo y el valor mínimo en un grupo de números aleatorios. Se le suele simbolizar con R.(Estadística Básica con R y R-Comander. Publicado en OCW-UCA)

Varianza
Artículo principal: Varianza

La varianza es una medida estadística que mide la dispersión de los valores respecto a un valor central (media), es decir, es el cuadrado de las desviaciones:





I
Propiedades
La varianza es siempre positiva o 0:
Si a los datos de la distribución les sumamos una cantidad constante la varianza no se modifica.

Si a los datos de la distribución los multiplicamos una constante, la varianza queda multiplicada por el cuadrado.

Propiedad distributiva:
Desviación típica
La varianza a veces no se interpreta claramente, ya que se mide en unidades cuadráticas. Para evitar ese problema se define otra medida de dispersión, que es la desviación típica, o desviación estándar, que se halla como la raíz cuadrada positiva de la varianza. La desviación típica informa sobre la dispersión de los datos respecto al valor de la media; cuanto mayor sea su valor, más dispersos estarán los datos.(Estadística Básica con R y R-Comander. Publicado en OCW-UCA)

Desviación típica muestral



 

 {\frac {\i}-\mu )^{2}}{n}}}}  Desviación típica poblacional
-->x = [17 14 2 5 8 7 6 8 5 4 3 15 9] x = 17. 14. 2. 5. 8. 7. 6. 8. 5. 4. 3. 15. 9. -->stdev(x) ans = 4.716311 -->
Primero hemos declarado un vector con nombre X, donde introduzco los números de la serie. Luego con el comando stdev se hallará la desviación típica.


Covarianza
La covarianza entre dos variables es un estadístico resumen indicador de si las puntuaciones están relacionadas entre sí. La formulación clásica, se simboliza por la letra griega sigma (σ) cuando ha sido calculada en la población. 

 

Este tipo de estadístico puede utilizarse para medir el grado de relación de dos variables si ambas utilizan una escala de medida a nivel de intervalo/razón (variables cuantitativas).
La expresión se resuelve promediando el producto de las puntuaciones diferenciales por su tamaño muestral (n pares de puntuaciones, n-1 en su forma insesgada).
(Estadística Básica con R y R-Comander. Publicado en OCW-UCA)

(Estadística Básica con R y R-Comander. Publicado en OCW-UCA) 

Coeficiente de Correlación de Pearson
El coeficiente de correlación de Pearson, r, permite saber si el ajuste de la nube de puntos a la recta de regresión obtenida es satisfactorio. Se define como el cociente entre la covarianza y el producto de las desviaciones típicas (raíz cuadrada de las varianzas).


Teniendo en cuenta el valor de la covarianza y las varianzas, se puede evaluar mediante cualquiera de las dos expresiones siguientes:
Ejemplo Para una muestra de valores (3, 3, 5, 6, 8), el dato de menor valor Min= 3 y el dato de mayor
valor Max= 8. Valor maximo=8

(Estadística Básica con R y R-Comander. Publicado en OCW-UCA) 

Propiedades
El coeficiente de correlación, r, presenta valores entre –1 y +1. 
Cuando r es próximo a 0, no hay correlación lineal entre las variables. La nube de puntos está muy dispersa o bien no forma una línea recta. No se puede trazar una recta de regresión. 

Cuando r es cercano a +1, hay una buena correlación positiva entre las variables según un modelo lineal y la recta de regresión que se determine tendrá pendiente positiva, será creciente. 

(Estadística Básica con R y R-Comander. Publicado en OCW-UCA) 






   

No hay comentarios:

Publicar un comentario