¿Cómo realizar una Clasificación Ascendente Jerárquica (CAJ) con XLSTAT?
Conjunto de datos para Clasificación Ascendente Jerárquica XLS141 KB
Una hoja Excel que incluye a la vez los datos y los resultados puede ser descargada haciendo clic aquà. Los datos proceden del US Census Bureau. Corresponden a la medición de parámetros demográficos en 51 Estados de los Estados-Unidos en 2000 y 2001. En el marco de este tutorial, solo los datos del año 2001 fueron conservados, y con el fin de suprimir los efectos de escala, las variables iniciales fueron convertidas en àndices por 1000 habitantes. El objetivo aquà es de crear grupos homogéneos de estados. Estos datos son también utilizados por el tutorial del análisis de Componentes Principales (ACP).
Una vez que XLSTAT-Pro éste activado, haga clic en el menú XLSTAT/ Análisis de datos/ Clasificación Ascendente Jerárquica (CAH), o haga clic en el botón correspondiente de la barra "Análisis de datos" (ver a continuación).


Una vez el botón pulsado, el cuadro de diálogo correspondiente a la CAH aparece. Puede entonces seleccionar los datos en la hoja Excel. Hay varias manera de seleccionar los datos en el cuadro de diálogo de XLSTAT (ver el tutorial del asunto). En el ejemplo estudiado aquà los datos empiezan desde la primera lànea; Es entonces más rápido elegir el modo de selección por columnas. Por esta razón, en el cuadro de diálogo a continuación las selecciones aparecen en forma de columnas.
La variable "Población total" no fue seleccionada ya que solos los aspectos dinámicos de la población nos interesa aquà. La última columna no fue seleccionada tampoco, ya que hemos visto con el análisis de componentes principales que las dos últimas columnas están perfectamente correlacionadas. La opción "Etiquetas de las columnas" es activada, ya que la primera lànea de datos incluye el nombre de las variables.

Las opciones Centrar/Reducir es activada de manera a evitar que algunas variables no influyen demasiado sobre el resultado con problemas de escala. La opción "Truncamiento automático" es activada para obtener el dendrograma (o árbol de clasificación) truncado.

Los cálculos empiezan cuando haga clic en el botón "OK". El primer resultado es el diagrama de los niveles. Su forma proporciona informaciones sobre la estructura de los datos. Cuando son observadas unas variaciones importantes, tenemos una agregación de estructuras homogéneas. Es en parte, sobre esta base, que está creado el truncamiento automático que permite determinar el número de grupos homogéneos.

El gráfico a continuación es el dendrograma. Representa, de manera clara, la manera de la que el algoritmo procede para reagrupar los individuos y luego los subgrupos. Al final, el algoritmo a reagrupado progresivamente todas las observaciones. La lànea de puntos representa el truncamiento y permite visualizar que dos grupos homogéneos fueron identificados. El primer grupo es muy homogeno, como lo confirman las Varianzas intraclase


Un cuadro que incluye el nombre de cada uno de los Estados y el grupo del cual es vinculado, aparece. Podrá ser reutilizado para otros análisis o para aplicaciones operacionales.
