Estadísticas descriptivas (box plots y scattergrams incluidos)

Utilice este módulo para calcular un conjunto de estadísticas descriptivas para una o varias variables, cualitativas o cuantitativas, y producir representaciones gráficas o semigráficas utilizadas en análisis exploratorio de datos.

Lista de las estadísticas calculadas en el caso de datos cuantitativos (los descriptores que tienen en cuenta los eventuales pesos, se señalan en negrita):

Núm. de valores utilizados: número de valores efectivamente utilizados en los cálculos, es decir, los valores que no faltan y de peso diferente a 0, Núm. de valores ignorados: número de valores ignorados durante los cálculos, es decir, valores que faltan o de peso nulo, Núm. de valor Min. : número de valores iguales al valor mà­nimo, % de valor Min. : porcentaje del número de valores iguales al valor mà­nimo, Mà­nimo : valor mà­nimo, El primer cuartil: valor por debajo del cual se encuentran el 25 % de los datos, Mediana : valor por debajo del cual se encuentran el 50 % de los datos, El tercer cuartil: valor por debajo del cual se encuentran el 75 % de los datos, Máximo : valor máximo, Recorrido : diferencia entre el máximo y el mà­nimo, Suma de peso: en el caso de datos ponderados, indica la suma de los pesos de valores utilizados en los cálculos, Total : suma de los valores, eventualmente ponderado, Media : suma de los valores, eventualmente ponderado, dividido por el número de valores utilizados, o por la suma de los pesos si los datos son ponderados, Media geométrica: media apenas influida por los valores elevados. La media geométrica no está definida para los datos que contienen valores negativos o nulos, Media armónica: media apenas influida por algunos valores mucho más elevados que el conjunto de los otros valores, pero sensible a los valores mucho más pequeños. La media armónica no está definida para los datos que contiene valores nulos, Aplastamiento (Pearson): coeficiente que caracteriza la forma del pico o el aplastamiento de una distribución con respecto a una distribución gaussiana. Para una distribución gaussiana (ley normal), el aplastamiento vale 0. Un valor negativo corresponde a una distribución más aplanada que la ley normal (distribución platicúrtica) mientras que un valor positivo corresponde a una distribución más picuda que la ley normal (distribución leptocúrtica), Asimetrà­a (Pearson): coeficiente que caracteriza el grado de asimetrà­a de una distribución con respecto a su media. Para una distribución gaussiana (ley normal), la asimetrà­a vale 0. Un valor negativo corresponde a la presencia de una cola de distribución hacia la izquierda mientras que un valor positivo corresponde a una cola de distribución hacia la derecha, Aplastamiento: coeficiente de aplastamiento tal como está calculado por Excel, Asimetrà­a : coeficiente de asimetrà­a tal como está calculado por Excel, CV (Desviación tà­pica / media): coeficiente de variación que mide la dispersión relativa obtenida dividiendo la desviación tà­pica por la media. Este coeficiente permite comparar la dispersión de variables cuyas unidades son diferentes, o que tienen medias muy diferentes, Varianza de una muestra: varianza de datos, Varianza estimada: estimación de la varianza de una población cuyos datos constituyen una muestra (estimador sin sesgo), Desviación tà­pica de una muestra: raà­z cuadrada de la varianza de datos, Desviación tà­pica estimada: raà­z cuadrada de la estimación de la varianza de la población de origen de datos, Desviación absoluta media: medida de dispersión que indica la media de valores absolutos de las desviaciones de cada valor con respecto a la media, Varianza de la media: raà­z cuadrada de la relación de la varianza estimada por el número de valores utilizados en los cálculos. Esta estimación de la varianza de la media es valida que si los datos constituyen una muestra conseguida al azar (y sin reemplazo) en el seno de una población infinita (muestra aleatoria simple de una población infinita / total).

Gráficos productos en el caso de variables cuantitativas:

gráficos " caja y bigote " o box plots, nubes de puntos univariadas o scattergrams, colección de nubes de puntos bivariadas, gráficos " Cuantile-Cuantile " o Q-Q plots, gráficos " probabilidad-probabilidad " o p-p plots, diagramas " tallo y hoja " o stem and leaf plots.

Lista de las estadísticas calculadas en el caso de datos cualitativos

Sà­ntesis para todas las variables: Núm. de modalidades: número de modalidades de la variable, Moda: la moda es la modalidad cuyo efectivo es el más elevado o cuyo peso es el más elevado (si los datos son ponderados), Frecuencia moda: en el caso de datos no ponderados, efectivo de la moda, Peso moda: en el caso de datos ponderados, peso de la moda, % moda: porcentaje de la moda, Frec. rel. moda : frecuencia relativa de la moda.

Tabla de las estadà­sticas para cada variable: Frecuencia : en el caso de datos no ponderados, frecuencia de la modalidad, Peso : en el caso de datos ponderados, peso de la modalidad, % : porcentaje de la modalidad, Frec. rel. : frecuencia relativa de la modalidad.

Gráficos productos en el caso de variables cualitativas:

histogramas, sectores.