domingo, 18 de septiembre de 2011

MEDIDAS DE DISPERSIÓN (EL RANGO)




Esta medida de dispersión no es desconocida para nosotros, pues ya hemos trabajado con la noción del valor mayor y menor de un conjunto de datos. Es conveniente definir el rango como tal:

El rango o amplitud es una medida de dispersión que se define como la diferencia entre el dato mayor y menor valor en un conjunto de datos.

Debido a que el Rango se calcula a partir de dos valores, esta medida de dispersión no nos aporta muchos elementos para determinar si los datos que se encuentren en ese intervalo tienen mucha o po0ca variabilidad; es más, el rango en determinado momento puede depender de la inclusión de más valores al conjunto de datos.

Para comprender la utilidad del rango, analizaremos la siguiente situación

Ejemplo:

Matilda quien es ahorrativa, registró sus datos escolares durante un mes, se encontraba de la siguiente manera:








Analizando estos datos, nos damos cuenta que el valor mínimo es 16 y el valor máximo es 25. Por tanto, los demás valores se encuentran distribuidos en ese intervalo.






Por lo tanto 9 es el valor del rango del conjunto de datos del ahorro de Matilda.

DESVIACION MEDIA

Brevemente, hacemos un recordatorio del significado del valor absoluto:

VALOR ABSOLUTO




La definición de un valor absoluto surge de la idea de la distancia, en unidades de un punto al origen, consecuentemente el valor absoluto debe ser positivo.


Ejemplos:

CALCULO DE LA DESVIACION MEDIA













La desviación media tiene su origen en las unidades que separan a los datos de la media aritmética, su definición formal es la siguiente:




La desviación media es una medida de dispersión de los datos respecto de la media aritmética.




Para calcular la desviación media de un conjunto de datos aplicamos la siguiente fórmula:








En base al manejo de fórmulas que se ha estado desarrollando, se considera claro cada uno de los elementos de la ecuación.





Retomando el ejemplo visto anteriormente de Matilda:





Ejemplo:





La tabla de datos ordenados es la siguiente:

El valor de la media aritmética de este conjunto de datos es el siguiente:


Después de sustituir los valores respectivos y realizar la operación, el valor de la media es:

Para hacer el cálculo de la desviación media, se construye la siguiente tabla auxiliar:

Retomando la fórmula de la desviación media y calculando los valores:

Como habrás notado, aún con pocos datos, el cálculo de la desviación media no resulta del todo sencilla y el cálculo se vuelve más laborioso en cuanto más crece el número de datos.

LA VARIANZA



La desviación media utiliza el valor absoluto para eliminar las cantidades negativas que resultan al compararlas con la media aritmética; otra forma de hacer esta eliminación de signo es utilizando la potenciación, en específico a la potencia dos o comúnmente dicho, elevar al cuadrado. En esta alternativa, la utiliza la varianza.

La varianza es una medida de dispersión equivalente al promedio de las desviaciones cuadráticas de los datos respecto de la media aritmética.

CALCULO DE LA VARIANZA PARA DATOS SIN AGRUPAR






Para calcular la varianza de un conjunto de datos no agrupados se utiliza la fórmula:




Lo que es equivalente a:

Un grupo de amigos registra su consumo mensual de crédito en su celular, con la finalidad de incluirse en un plan tarifario. Los datos registrados son los siguientes:


Puesto que el plan tarifario lo compartirían por partes iguales es necesario saber la desviación estándar del grupo.


En este caso, se aplicará la primera fórmula; para este procedimiento, se hará uso de una tabla auxiliar. En primer lugar se ordenan los datos y se agregan las columnas auxiliares para elaborar la tabla:



En segundo lugar, se calcula el valor de la media, utilizando la fórmula:


En la tabla se ha calculado ya el valor de la sumatoria, por tanto, sólo resta hacer las sustituciones correspondientes.

Se realiza el cálculo de las columnas correspondientes:


LA DESVIACION TIPICA







A la desviación típica se la conoce también como desviación estándar, y mide el grado en que los datos se encuentran dispersos en relación a la media aritmética.+




La desviación típica o desviación estándar es equivalente a la raíz cuadrada del valor obtenido de la varianza.
La fórmula para calcular la varianza es la siguiente:

De igual forma, se puede calcular a partir de la fórmula alternativa:


Para el ejemplo del gasto mensual en telefonía celular, los datos tienen la siguiente varianza:





No se realiza el cálculo para la segunda fórmula, pues obviamente obtendremos el mismo resultado.

CALCULO DE LA VARIANZA PARA DATOS AGRUPADOS





Para calcular la varianza de una tabla de frecuencias, es necesario utilizar la siguiente fórmula:




Donde:


Para calcular el valor de la varianza, se plantean los siguientes datos.

Ejemplo:


En el rancho “Laguna Seca”, se hizo un conteo de las cabezas de ganado.
Agrupándolas por los meses cumplidos de la siguiente manera:

La tabla anterior representa las cabezas de ganado del rancho “Laguna Seca”.
Se construye la tabla auxiliar para el cálculo de los datos:



La tabla anterior es la tabla auxiliar de la varianza de las cabezas de ganado del rancho “Laguna Seca”.

Se tienen todos los elementos para hacer las sustituciones correspondientes en la fórmula:

De manera inmediata, se obtiene el valor de la desviación típica o estándar.

MEDIDAS DE FORMA (SESGO)




Se han realizado comentarios previos sobre la relación que guardan la media, la mediana y la moda, pues resulta interesante que a partir de los valores que tomen, la distribución puede representar o no cierta simetría o sesgo.
El sesgo es el grado de asimetría o falta de asimetría de una distribución.
Dentro de las características más importantes que se pueden observar gráficamente, son las siguientes:




  • Una curva es simétrica si las observaciones o datos son equidistantes con el valor máximo centrado en la curva.


  • Si la distribución tiene una cola más larga a la derecha del máximo que a la izquierda, la distribución recibe el nombre de asimetría positiva, sesgada a la derecha o que tiene sesgo positivo.


  • En el caso en que una distribución tenga una cola más larga a la izquierda, a la distribución se le denomina asimetría negativa, sesgada a la izquierda o que tiene sesgo negativo.


  • Una forma de estimar el sesgo o nivel de asimetría de una distribución es mediante la siguiente expresión:




Donde, como sabemos:
Las operaciones que intervienen en el cálculo del sesgo, todas se calculan a partir del conjunto de datos.



El valor del sesgo puede ser el siguiente:

En lo que representa al valor máximo y mínimo de los datos, la distribución puede adoptar las siguientes formas:



En cuanto a la moda, como es de tu conocimiento, representa el valor más alto o máximo de la curva del polígono de frecuencias; como se ha estudiado, una distribución puede no tener moda, o bien puede presentar más de una, la presencia de más de una moda indica que los datos no son homogéneos, las formas que representan son las siguientes:

Los diferentes tipos de asimetría, se pueden visualizar en las siguientes imágenes:



APUNTAMIENTO








Las distribuciones pueden presentar o no un cierto tipo de punta o apuntamiento, en el caso de las distribuciones uniformes, esto no está presente, o bien, en las distribuciones multimodales existen muchos de éstos apuntamientos.






El coeficiente de curtosis, que indica el grado de apuntamiento de la distribución, se puede calcular utilizando la siguiente fórmula:

Donde:


S= desviación estandar.


Los demás parámetros, a este nivel del curso, ya deben ser de tu dominio.


Al calcular el índice, se tiene la siguiente clasificación:



Para contribuir en la comprensión de este concepto, se presenta la siguiente situación.
Ejemplo:

En una pequeña cooperativa familiar, se observó el cultivo del hongo seta (pleurotus ostreatus), durante un año y se registró el valor de producción mensual en la siguiente tabla:


De los datos anteriores, se generó la gráfica siguiente:


De la gráfica anterior, calcula el coeficiente de curtosis:

El valor de la media aritmética, se calcula de manera inmediata:

Es ejercicio para el estudiante, verificar el cálculo de la desviación estándar.




Sustituimos los valores en la fórmula:

El valor calculado se confronta con 0.263, resultando que -0.5454<0.263; por tanto la distribución es platicúrtica o achatada.

MOMENTOS

Para el análisis de una variable, es necesario presentar su distribución de valores y medidas más características, precisamente la teoría de momentos se ha desarrollado para lograr una uniformidad en el ejercicio de estudiar o analizar las variables.

Los momentos son operadores que unifican el cálculo de las medidas de posición, dispersión y forma, permitiendo diferenciar así una distribución de otra.

Los tipos de momentos, se clasifican de acuerdo a lo siguiente:


  • Momentos con respecto al origen. El origen del que se habla es el propio de la variable.

  • Momentos con respecto a la media. En este caso, el origen es la media aritmética de la variable.

  • Momentos con respecto a cualquier posición de la variable. El origen es cualquier valor posible de la variable.

MOMENTOS CON RESPECTO AL ORIGEN



El momento al origen de un conjunto de datos, el momento de orden “r” de este conjunto de datos está dado por la expresión:



Donde:




De esta forma, el momento de orden 0, está dado por la fórmula:


Ya que la suma de las frecuencias es igual al número de datos, entonces el valor del dividendo y divisor será el mismo, resultando el cociente es 1; además .
El momento de orden 1, se encuentra definido de la siguiente manera.

La ecuación anterior, como te habrás dado cuenta, corresponde el valor de la media aritmética.

MOMENTOS CON RESPECTO A LA MEDIA





El momento de r = 0 de un conjunto de datos, se calcula mediante la fórmula:


Donde:

Realizando las sustituciones correspondientes, el valor del momento a la media para r = 0 y r = 1, es el siguiente:

Lo cual corresponde al valor de la varianza y se conoce así como momento de la varianza o de orden 2.


Se puede continuar calculando los momentos siguientes y son de utilidad y cuanto más se calculen, quedará mejor definida la distribución.Los momentos nos proporcionan medidas ya conocidas, de esta forma

MOMENTOS CON RESPECTO A CUALQUIER VALOR DE LA VARIABLE

En lo que respecta a este tipo de momentos, se calculan por medio de la siguiente fórmula:
Respecto a este tipo de momentos, no nos relaciona alguna de las medidas de tendencia central y de dispersión estudiadas.

RELACIÓN ENTRE LOS DIFERENTRES SEGMENTOS

Los momentos, de acuerdo a la forma en que se calculan, se relacionan con otros momentos, cada una de las afirmaciones siguientes, son demostrables; Sin embargo, no se considera que sea necesario ahondar en este punto de demostraciones formales.



  • Los momentos con respecto a la media, se pueden expresar en función de los momentos respecto al origen de igual e inferior orden. En general, un momento de orden r respecto a la mediase puede expresar como una función de los primeros r momentos respecto al origen.

Aplicaremos los momentos en el siguiente ejercicio.


Ejemplo:


Después de organizar los datos de los edades de una muestra, se tienen los siguientes datos. Se nos pide calcular el momento de tercer orden respecto a la media de dicha información:


Para realizar la operación indicada, se construye una tabla auxiliar; cabe aclarar que para estandarizar con los valores de la fórmula se está utilizando la variable , la cual representa el valor de la marca de clase.


El valor de la media aritmética es de 27.22


Se tienen todos los datos necesarios para hacer las sustituciones correspondientes en la fórmula: