¿Cómo crear una tabla cruzada inteligente con XLSTAT-Pivot?

Conjunto de datos para Pivot table XLS1.46 MB

Vídeo de tutorial
  • Pivot Software estadístico para crear tablas pivote

  • Configuración del sistema

    • Windows:
      • Versiones: 9x/Me/NT/2000/XP/Vista/Win 7
      • Excel: 97 o superior
      • Procesador: 32 o 64 bits
      • Disco duro: 150 Mb
    • Mac OS X:
      • OS: OS X
      • Excel: X, 2004 y 2011
      • Disco duro: 150 Mb

Ventajas

  • Sencillo y dirigido a los usuarios
    Sencillo y dirigido a los usuarios XLSTAT es un software que se integra de forma transparente con Microsoft Excel, que es la hoja de cálculo más difundida del mundo. Esta integración hace que sea una de las herramientas más sencillas para trabajar ya que utiliza la misma filosofía que Microsoft Excel. El programa está disponible en una ficha de XLSTAT. Los análisis se agrupan en menús funcionales. Los cuadros de diálogo están dirigidos a los usuarios, por lo que la preparación de los análisis es tarea sencilla.
  • Resultados y datos compartidos sin dificultad
    Resultados y datos compartidos sin dificultad Una de las mayores ventajas de XLSTAT es la forma transparente con la que se pueden compartir los datos y los resultados. Los resultados se almacenan en Microsoft Excel de modo que cualquier usuario puede acceder a ellos. No es necesario que el destinatario tenga una licencia de XLSTAT o cualquier visor adicional, lo que facilita y rentabiliza el trabajo en equipo. Del mismo modo, es fácil integrar los resultados en otras aplicaciones de Microsoft Office, como PowerPoint, por lo que se pueden crear estupendas presentaciones en cuestión de minutos.
  • Modular
    Modular XLSTAT es un producto modular. XLSTAT-Pro es un módulo principal de estadística de XLSTAT, que incluye todas las funcionalidades dominantes en el análisis estadístico y multivariado. Es posible añadir funciones más avanzadas por medio de módulos complementarios para aplicaciones específicas. De este modo es posible adaptar el software a sus necesidades, aumentando la rentabilidad.
  • Didáctico
    Didáctico Los resultados de XLSTAT están organizados por análisis y es fácil desplazarse por ellos. La información útil se proporciona junto con los resultados para ayudarle en su interpretación.
  • Asequible
    Asequible XLSTAT es una solución completa y modular que se puede ajustar a cualquier necesidad de análisis comercial. Tiene un precio muy razonable, por lo que el retorno de su inversión es casi inmediato. Todas las licencias de XLSTAT incluyen también un servicio de asistencia de la mayor calidad.
  • Accesible: disponible en muchos idiomas
    Accesible: disponible en muchos idiomas Nos hemos asegurado de que XLSTAT sea accesible para todos traduciendo el programa a muchos idiomas, incluyendo chino, inglés, alemán, italiano, japonés, polaco, portugués y español.
  • Automatizable y personalizable
    Automatizable y personalizable La mayoría de las funciones estadísticas disponibles en XLSTAT pueden llamarse directamente desde la ventana Visual Basic de Microsoft Excel. Pueden modificarse e integrarse en código fuente adicional para ajustarse a sus necesidades. Añadir tablas y trazados, así como modificar los resultados existentes se convierte en tarea sencilla. Además, XLSTAT incluye algunas herramientas especiales en los cuadros de diálogo para generar automáticamente el código fuente VBA para reproducir su análisis empleando el editor de VBA o simplemente cargar ajustes predeterminados. Esta automatización de análisis rutinarios sin esfuerzo le ahorrará gran cantidad de tiempo.

Dataset to create an intelligent pivot table

An Excel sheet (zipped file) with both the data and the results can be downloaded by clicking here. The data were collected during the 1994 Census by the American Census Bureau (http://www.census.gov).

This dataset has been used several times by statisticians to evaluate the predictive performance of new algorithms. Each record contains 8 descriptors about an individual, like age, occupation, education, sex, etc. The number of records has been limited to 8000. The weight variable (allowing each individual to represent a certain percentage of the population) is not used in the example below. 

Goal of this tutorial

The goal is here to quickly build a pivot table and a contribution chart that will help the user to understand which factors and combination of factors most influence the fact that an individual has a revenue greater or lower than 50k$ (the corresponding variable is in column J). XLSTAT-Pivot enables to quickly and easily do this.

Generating an intelligent pivot table

Once XLSTAT is open, select the XLSTAT / Descriptive statistics / XLSTAT-Pivot command, or click on the corresponding button of the Descriptive statistics menu (see below).

Menu pivot

Once you have clicked on the button, the XLSTAT-Pivot dialog box appears.

Select the data on the Excel sheet. As the first row corresponds to the labels, and as the next rows correspond to data, it is possible to use the quickest selection mode of XLSTAT: select directly columns by clicking on the corresponding letters.

Select the Labels included option as the first row corresponds to the name of the variables.

Note that the explanatory and response variables can be either qualitative or quantitative variables.

As the variable to explain is a qualitative variable, select qualitative for the type of variable. Then select the target modality to be used in the pivot table. In our case, we focus on the ">50K" case.

Dialog box general pivot

Then click on Ok so that XLSTAT-Pivot can start the computations. XLSTAT-Pivot algorithm is based on classifiaction trees and the CHAID algorithm.

The next dialog box displays the options for creating the optimal pivot tables. Select the variables which you want to use in the pivot tables. The contributions of the variables to the model are displayed next to the variable name (the higher the contribution, the more information it brings to explain the variability of the explanatory variable).

Once you are satisfied with the selection (in this example we did not change anything to the default options), click on Continue.

Dialog box selection pivot

 

Interpreting an intelligent pivot table

A new sheet is displayed with a histogram of the contributions of the variables, and a dynamic pivot table.

Contribution plot pivot

The chart confirms that the variables that have the highest effect on the revenue are the Marital status followed by the number of years of education.

The dynamic pivot table can display up to 4 values for each combination of categories:

  • Target average: Percentage of the cases where the target category of the response variable is present in the case of a qualitative variable; average of the target variable calculated on the sub-population corresponding to the combination in the case of continuous variable;
  • Target size: Count of the occurrences of the target category for the response variable in the case of qualitative variable;
  • Population size %: Percentage of the overall population corresponding to the combination;
  • Population size: Population size corresponding to the combination.

The pivot table is as follows:

 Pivot table

We should now analyze the dynamic pivot table, to identify the combinations that most influence the fact that the people earn more than 50k$.

Note that once you have a pivot table, it might be interesting to do a correspondence analysis o to see how the categories of the various explanatory variables are related to each other. To build the input table, keep only the "Target size" values.