¿Cómo realizar un histograma con XLSTAT?

Una hoja Excel que contiene los datos y resultados de este ejemplo puede ser descargada haciendo clic aquí. Los datos corresponden a una experiencia donde 200 muestras de agua, tomadas en un río, fueron puestas en cultivo en un medio nutritivo, con el fin de determinar la presencia o no de bacterias tipo E.coli. El número de colonias ha sido contado después de tres días de incubación. El resultado de los cálculos se encuentra en la columna "Bact-Data" por cada una de las 200 muestras.

Utilizando en primer lugar las herramientas de XLSTAT que permite crear histogramas, luego utilizando la herramienta de ajuste de una ley de distribución, deseamos comprobar si la muestra (en sentido estadístico) de los 200 recuentos sigue una ley binomial negativa o no. La ley binomial negativa representa muy a menudo el fenómeno de agregación/dispersión de las bacterias en los medios acuáticos.

Una vez XLSTAT iniciado, elija el comando XLSTAT/Descripción de los datos/Histogramas o haga clic en el botón "Histogramas" de la barra de herramientas "Descripción de los datos".

bardesc1.gif

Una vez el botón presionado, aparece el cuadro de diálogo. Puede elegir entonces los datos en la hoja Excel. La opción "discretos" está activada ya que los datos de recuento son efectivamente datos discretos. La opción "Etiqueta de columna" se deja activada ya que la primera línea de las columnas de datos incluye el nombre de la variable.

histo1.gif

Una vez que haga clic en el botón "OK ", los cálculos son efectuados, y luego el histograma aparece. El primer resultado visualizado es el cuadro que sirve para la construcción del histograma. Más abajo de este cuadro está representado el histograma. Observamos que la clase 0 es la más numerosa, y que representa más del 20% de los datos. Es decir, en más de una muestra de agua sobre cinco, ninguna bacteria pudo ser resaltada. Después, se observa una disminución rápida y suficientemente regular de las frecuencias relativas. En una muestra, se han encontrado hasta 36 colonias.

histo2.gif

Como deseamos hacer a continuación una prueba de ajuste a la ley binomial negativa (la prueba del Khi² necesita que incluya al menos 5 datos por clase), y dado la imprecisión de los recuentos de bacterias, parece necesario agrupar los recuentos en clases más importantes. Para eso, se crea una lista de límites que parece coherente (0,1,2,3,4,5,10,15,20,40) con la problemática. Con el fin de comprobar que las nuevas clases resultantes responden bien a las exigencias de la prueba de ajuste del Khi², hacemos un nuevo histograma utilizando la herramienta de "Discretización" de datos, que permite libremente crear clases.

Se puede elegir el comando XLSTAT/Preparación de los datos/Discretización del menú XLSTAT o hacer clic en el botón "Discretización" de la barra de herramientas "Preparación de los datos".

bardisc1.gif

Una vez el botón presionado, aparece el cuadro de diálogo. Puede entonces seleccionar los datos en la hoja Excel. La opción "Lista de límites" es activada, y luego la lista de límites es seleccionada. Se hace clic a continuación en "Importar", y los límites y las frecuencias aparecen en la parte inferior del cuadro. Es aquí el momento de realizar eventuales modificaciones de los límites con el fin de corregir los efectivos de las clases. En nuestro caso, no vale la pena, ya que el más pequeño efectivo es 6, lo que es suficiente.

histo3.gif

Se puede entonces hacer clic en el botón OK para que aparezcan los resultados. Se observa a continuación el nuevo histograma obtenido.

histo4.gif

Satisfechos de estos resultados, podemos entonces utilizar la herramienta de ajuste de una ley de distribución para comprobar si la muestra sigue bien una ley binomial negativa.

Elija el comando XLSTAT/Modelización/Ajuste de una ley de probabilidad o haga clic en el botón "Ajuste de una ley de probabilidad" de la barra de herramientas "Modelización".

bardfit1.gif

Una vez el botón presionado, aparece el cuadro de diálogo. Puede elegir entonces los datos en la hoja Excel. Dejamos XLSTAT libre de "estimar" los parámetros de la ley binomial negativa. XLSTAT propone dos formulaciones de la ley binomial negativa. La segunda es la más adaptada a este tipo de datos. Activamos las opciones de prueba de Kolmogorov-Smirnov y de prueba de conformidad del Khi², necesarias para comprobar nuestra hipótesis. Para la prueba del khi², decidimos que será realizada con las clases anteriormente creadas.

histo5.gif

El primer resultado que nos interesa es el valor de los parámetros k y p de la ley binomial negativa (ajustado mediante el método del máximo de verosimilitud), así como los cálculos de la esperanza y de la varianza teórica.

histo6.gif

Se nota aquí que las esperanzas y las varianzas no son demasiado diferentes, lo que se justifica por el tamaño de la muestra y la buena adecuación a la ley. (NB: la esperanza teórica vale kp, y la varianza teórica vale kp(p+1)).

La prueba de Kolmogorov Smirnov permite comprobar si la distancia más grande entre las funciones de repartición empíricas y teóricas está más allá de un valor critico o no. Según los resultados obtenidos aquí (p-value=0.129), al nivel de significación de 5%, se concluye que no se puede rechazar la hipótesis que los recuentos siguen una binomial negativa de parámetros k=0.839, p=5.763. La prueba Kolmogorov Smirnov es reputada más adaptada que la prueba de conformidad del Khi² en el caso de las leyes de probabilidades (o distribuciones) continuas, lo que no es el caso con la ley binomial negativa. Parece entonces oportuno realizar una prueba de ajuste del Khi².

La prueba de conformidad del Khi² permite comprobar si la distancia del Khi² entre la distribución empírica y la distribución teórica, calculada sobre las clases, no está más allá de un valor critico. Es posible comparar la visualización de los histogramas teóricos y observados en la siguiente figura. Para la clase 1 y la clase 6, parece haber una ligera inadecuación (se ha encontrado más muestras sin bacteria, que lo sugiere la ley teórica, y menos muestras en la clase 6).

histo7.gif

A pesar de estas leves desviaciones, el p-value asociado a la prueba (0.360) es claramente superior al nivel de significación que se ha determinado (0.05). La prueba del Khi² conforta entonces ampliamente lo que sugería la prueba de Kolmogorov Smirnov.

En conclusión, la presencia de la bacteria estudiada en el río donde obtuvieron las muestras, sigue una ley binomial negativa de parámetros (k=0.839, p=5.763), con una esperanza de 4.8 y una varianza de 32.7.

Haga clic aquí para acceder a otros tutoriales.