ESTADÍSTICOS UNIVARIABLES: MEDIDAS RESUMEN PARA VARIABLES CUANTITATIVAS

Las observaciones que serán sujetas a medición, además de poder ser resumidas en tablas de frecuencia, pueden resumirse en lo que conocemos como estadísticos. Así, encontramos diversas medidas estadísticas, que son las medidas de tendencia central, que dan idea de los valores alrededor de los cuales el resto tienen tendencia a agruparse; las medidas de posición, que dividen un conjunto ordenado de datos en grupos con la misma cantidad de individuos; y las medidas de dispersión o variabilidad, que dan información acerca de la heterogeneidad de nuestras observaciones.

Las medidas de tendencia central son la media, la mediana y la moda.

  • La media aritmética o media (x), es la más usada y la más básica en estadística descriptiva. Siempre va acompañada de la desviación típica, y se usa para el cálculo de variables cuantitativas, siendo la suma de todos los valores de la variable sujeta a estudio, entre el total de observaciones. Esta consta de una serie de propiedades: la suma de las desviaciones respecto a ella es igual a cero, no se ve alterada por una transformación lineal de escala (ante la suma o multiplicación por una constante K, la media aumenta o se ve multiplicada por dicha K), y es muy sensible a las puntuaciones extremas.
  • En el caso de la mediana (Me), es una posición, ya que es la puntuación que ocupa la posición central de la distribución, por lo que es el punto medio de la distribución de valores respecto a la posición, por lo que es necesario un orden. Si media y mediana son iguales, esto implica por tanto que la distribución de los valores de la variable es simétrica.
  • En cuanto a la moda (Mo), es el estadístico de menor uso. Es el valor que se repite un mayor número de veces en la distribución. La muestra puede ser unimodal (una sola moda), bimodal (dos modas) o multimodal (más de dos). En el caso de muestras unimodales simétricas, los valores de media aritmética, mediana y moda coinciden.
Para comprender su cálculo, recomiendo el siguiente vídeo:


Las medidas de posición son los cuantiles, que se emplean en variables cuantitativas, y entre los que encontramos cuartiles, deciles y percentiles. Los cuantiles se definen como un valor por debajo del cual se encuentra una frecuencia acumulada de valores, por lo que para su cálculo es necesario que los datos estén ordenados de menor a mayor.
  • Hablamos de percentiles (Pn) cuando la muestra ordenada se divide en cien partes.
  • Hablamos de deciles (Dn) cuando la muestra ordenada se divide en diez partes.
  • Hablamos de cuartiles (Q1, Q2, Q3 y Q4) cuando la muestra ordenada se divide en cuatro partes.

Para una mejor comprensión, chequea el siguiente vídeo:


En el caso de las medidas de dispersión se usan porque aportan información cuando la aportada por otros estadísticos es limitada. Hablamos de rango, desviación media, varianza, desviación típica y coeficiente de variación.
  • El rango o recorrido (R) es la medida más simple, y consiste en tomar el valor mayor y restarle el valor menor, por lo que se ve muy afectado por los valores extremos, de ahí su limitación.
  • La desviación media (DM) es la media aritmética de las distancias de cada observación con respecto a la media de la muestra.
  • La varianza es la media de los cuadrados de las diferencias entre cada valor de la variable y la media aritmética de la distribución, o lo que es lo mismo, mide la dispersión de los datos de una muestra respecto a la media, calculando la media de los cuadrados de las distancias de todos los datos.
  • La desviación típica o estándar (S), se emplea en los estudios descriptivos y siempre acompaña a la media, como mencionábamos anteriormente. Esta expresa la dispersión de la distribución mediante un valor que siempre es positivo, y en las mismas unidades de medida de la variable. Si los datos se alejan de la media, el numerador será grande y por tanto también la varianza y la desviación típica. Sus propiedades son similares a la de la media.
  • El coeficiente de variación (CV) es una medida adimensional y nos permite comparar la dispersión de dos o más grupos. Se calcula dividiendo la desviación típica entre la media de la muestra (expresado en porcentaje).
Un ejemplo de su cálculo se muestra en el siguiente vídeo:


La distribución normal, distribución de Gauss o distribución gaussiana de los datos de las variables de un estudio es el modelo clásico de distribución de las mismas en estadística. La curva gráfica que se observa es lo que se conoce como campana de Gauss, siendo esta gráfica simétrica respecto de los valores de posición central, o lo que es lo mismo, media, mediana y moda.

Campana de Gauss
Las asimetrías pueden ser hacia la derecha o izquierda (positivas o negativas), y la curtosis es el aplanamiento de la curva. En todos los casos, esto nos indica mediante su observación cuál es la concentración de los datos. De esta forma:


La asimetría o sesgo puede observarse a partir de esta gráfica, y por tanto, también el coeficiente de sesgo, o lo que es lo mismo, el grado de simetría en la distribución. De esta forma. si la distribución es asimétrica o sesgada, podremos observar un pico que no está centrado y una cola más larga que la otra, siendo adimensional y tomando valores entre -1 y 1.
  • Cuando la curva es simétrica, el eje está en el centro, coincidiendo con media, mediana y moda. Existe por tanto una concentración de valores exacta a la derecha y a la izquierda, siendo g1 = 0.
  • Cuando es asimétrica positiva (g1 > 0), existe una cola mayor a la derecha, quedando los valores más elevados a la izquierda.
  • Si es asimétrica negativa (g1 < 0), existe una cola mayor a la izquierda, quedando los valores más elevados a la derecha.
La curtosis es, por su parte, es el apuntamiento del pico de la curva. También es adimensional, y toma valores entre -1 y 1. Cuando la distribución es normal mesocúrtica, este es igual a 0. Cuando el grado de curtosis es positivo (g2 > 0), hablamos de una distribución leptocúrtica. Si g2 < 0, hablamos de una distribución platicúrtica.



¡Hasta aquí el resumen! Si tienes alguna duda, déjala en comentarios. ¡Hasta la próxima!

Comentarios