Simulaciones de Monte Carlo

Las simulaciones Monte Carlo son una herramienta clave para la toma de decisiones en el análisis estadístico de riesgos de modelos que pueden contener valores inciertos. Disponible en Excel utilizando XLSTAT.

sim-box-plots.png

Las simulaciones Monte Carlo son una herramienta clave para la toma de decisiones en el análisis estadístico de riesgos de modelos que pueden contener valores inciertos. Disponible en Excel utilizando XLSTAT.

¿Qué es una Simulación de Montecarlo en XLSTAT?

La Simulación de Montecarlo es un módulo que permite construir y computar modelos de simulación, un método innovador para la estimación de variables, cuyo valor exacto no se conoce, pero que puede ser estimado mediante la simulación repetida de variables aleatorias que siguen ciertas leyes teóricas. Antes de ejecutar el modelo, es necesario crearlo, definiendo una serie de variables de entrada y salida (o resultado).

Los modelos de simulación permiten obtener información, como la media o la mediana, sobre variables que no tienen un valor exacto, pero para las que podemos conocer, suponer o calcular una distribución. Si algunas variables de "resultado" dependen de estas variables "distribuidas" mediante fórmulas conocidas o asumidas, entonces las variables de "resultado" también tendrán una distribución. XLSTAT-Sim permite definir las distribuciones, y luego obtener mediante simulaciones una distribución empírica de las variables de entrada y salida, así como los estadísticos correspondientes.

Los modelos de simulación se utilizan en muchos ámbitos, como las finanzas y los seguros, la medicina, la prospección de petróleo y gas, la contabilidad o la predicción de ventas.

En la construcción de un modelo de simulación intervienen cuatro elementos:

  • Las distribuciones están asociadas a las variables aleatorias. XLSTAT permite elegir entre más de 20 distribuciones para describir la incertidumbre de los valores que puede tomar una variable (véase el capítulo. Por ejemplo, puede elegir una distribución triangular si tiene una cantidad para la que sabe que puede variar entre dos límites, pero con un valor que es más probable (una moda). En cada iteración del cálculo del modelo de simulación, se realiza una extracción aleatoria en cada distribución que se haya definido.
  • Las variables de escenario permiten incluir en el modelo de simulación una cantidad que es fija en el modelo, excepto durante el análisis del tornado, donde puede variar entre dos límites.
  • Las variables de resultado corresponden a los resultados del modelo. Dependen directa o indirectamente, a través de una o varias fórmulas de Excel, de las variables aleatorias a las que se han asociado distribuciones y, si están disponibles, de las variables del escenario. El objetivo del cálculo del modelo de simulación es obtener la distribución de las variables de resultado.
  • Las estadísticas permiten el seguimiento de una determinada estadística como variable de resultado. Por ejemplo, podríamos querer controlar la desviación estándar de una variable de resultado.

Un modelo correcto debe comprender al menos una distribución y un resultado. Los modelos pueden contener cualquier número de estos cuatro elementos.

Un modelo puede limitarse a una sola hoja de Excel o puede utilizar toda una carpeta de Excel.

Los modelos de simulación pueden tener en cuenta las dependencias entre las variables de entrada descritas por las distribuciones. Si sabe que dos variables suelen estar relacionadas de tal manera que el coeficiente de correlación entre ellas es de 0,4, entonces quiere que, al hacer las simulaciones, los valores muestreados para ambas variables tengan la misma propiedad. Esto es posible en XLSTAT-Sim introduciendo en el cuadro de diálogo Ejecutar la matriz de correlación o covarianza entre algunas o todas las variables aleatorias de entrada utilizadas en el modelo.

¿Cómo configurar una simulación Monte Carlo en XLSTAT?

Pestaña General:

Modelo limitado a Esta opción permite definir el tamaño del modelo de simulación activo. Limite si es posible su modelo a una sola hoja de Excel. Están disponibles las siguientes opciones:

  • Hoja: Sólo se utilizarán en el modelo de simulación las funciones de simulación de la hoja de Excel activa. Las demás hojas se ignoran.
  • Libro de trabajo: Todas las funciones de simulación del libro de trabajo activo se incluyen en el modelo de simulación. Esta opción permite utilizar varias hojas de Excel para un mismo modelo.

Método de muestreo: Esta opción permite elegir el método de generación de la muestra. Existen dos posibilidades:

  • Clásico: Las muestras se generan mediante simulaciones de Montecarlo.
  • Hipercubos latinos: Las muestras se generan mediante el método de hipercubos latinos. Este método divide la función de distribución de la variable en secciones que tienen el mismo tamaño y luego genera muestras de igual tamaño dentro de cada sección. Esto hace que la simulación converja más rápidamente. Se puede introducir el número de secciones. El valor por defecto es 500.

Memoria de un solo paso: Introduzca el número máximo de pasos de simulación que se almacenarán en el modo de paso único para calcular los campos estadísticos. Cuando se alcanza el límite, la ventana avanza (se olvida la primera iteración y se almacena la nueva). El valor por defecto es 500. Este valor puede ser mayor, si es necesario.

Número de iteraciones por paso: Introduzca el valor del número de iteraciones de simulación que se realizan durante un paso. El valor por defecto es 1.

Ficha Formato:

Utilice estas opciones para establecer el formato de los distintos elementos del modelo que se muestran en las hojas de Excel:

  • Distribuciones: Puede definir el color de la fuente y el color del fondo de las celdas donde se almacena la definición de las variables aleatorias de entrada y sus correspondientes distribuciones.
  • Variables de escenario: Se puede definir el color de la fuente y el color del fondo de las celdas donde se almacenan las variables de escenario.
  • Variables de resultado: Se puede definir el color de la fuente y el color del fondo de las celdas donde se almacenan las variables de resultado.
  • Estadísticas: Puede definir el color de la fuente y el color del fondo de las celdas donde se almacenan las estadísticas.

Pestaña de convergencia:

Condiciones de parada: Active esta opción para detener la simulación si se alcanzan los criterios de convergencia.

  • Criterio: Seleccione el criterio que debe utilizarse para comprobar la convergencia. Hay tres opciones disponibles:
  • Media: Para comprobar si se cumplen las condiciones de convergencia se utilizarán las medias de las "variables de resultado" monitorizadas (ver más adelante) del modelo de simulación.
  • Desviación estándar: La desviación estándar de las "variables de resultado" controladas (véase más adelante) del modelo de simulación se utilizará para comprobar si se cumplen las condiciones de convergencia.
  • Percentil: Los percentiles de las "variables de resultado" monitorizadas (ver más abajo) del modelo de simulación se utilizarán para comprobar si se cumplen las condiciones de convergencia. Elija el Percentil que se utilizará. El valor por defecto es el 90%.
  • Frecuencia de las pruebas: Introduzca el número de iteraciones a realizar antes de volver a comprobar los criterios de convergencia. Valor por defecto: 100.
  • Convergencia: Introduzca el valor en % de la evolución de los criterios de convergencia de una comprobación a la siguiente, que, cuando se alcanza, significa que el algoritmo ha convergido. Valor por defecto: 3%.
  • Intervalo de confianza (%): Introduzca el tamaño en % del intervalo de confianza que se calcula en torno al criterio seleccionado. El límite superior del intervalo se compara con el valor de convergencia definido anteriormente, para determinar si se ha alcanzado la convergencia o no. Valor por defecto: 95%.
  • Resultados monitorizados: Seleccione qué variables de resultado del modelo de simulación deben ser monitorizadas para la convergencia. Hay dos opciones disponibles:
  • Todas las variables de resultado: Todas las variables de resultado del modelo de simulación serán monitoreadas durante la prueba de convergencia.
  • Variables de resultado activadas: Sólo se monitorizan las variables de resultado que tienen su parámetro ConvActive igual a 1.

Ficha Referencias:

Referencia a celdas de Excel: Selecciona la forma en que se generan las referencias a los nombres de las variables a los modelos de simulación:

  • Referencia absoluta: XLSTAT crea referencias absolutas (por ejemplo $A$4) a la celda.
  • Referencia relativa: XLSTAT crea referencias relativas (por ejemplo A4) a la celda.

Nota: La referencia absoluta no se modificará si se copia y pega la fórmula de XLSTAT_Sim, al contrario que la referencia relativa.

Pestaña Resultados:

Nivel de filtrado de los resultados: Seleccione el nivel de detalles que se mostrará en el informe. Esto controla las tablas de estadísticas descriptivas y los histogramas de los diferentes elementos del modelo:

  • Todos: Se muestran los detalles de todos los elementos del modelo.
  • Activado: Los detalles sólo se muestran para los elementos que tienen un valor del parámetro Visible establecido en 1.
  • Ninguna: No se mostrarán detalles para los elementos del modelo.

¿Cuáles son los resultados de una Simulación Monte Carlo en XLSTAT?

Cuando se ejecuta el modelo, se muestran una serie de resultados. Al mismo tiempo que da los estadísticos críticos como son la información sobre la distribución de las variables de entrada y de resultado, también permite interpretar las relaciones entre las variables. El análisis de sensibilidad también está disponible si se han incluido variables de escenario.

Estadísticas descriptivas

El informe que se genera tras la simulación contiene información sobre las distribuciones del modelo. El usuario puede elegir entre una serie de estadísticas descriptivas los indicadores más importantes que deben integrarse en el informe para interpretar fácilmente los resultados. También se dispone de una selección de gráficos para mostrar gráficamente las relaciones.

Los detalles y las fórmulas relativas a las estadísticas descriptivas están disponibles en la sección de descripción de la herramienta de estadísticas descriptivas de XLSTAT.

Correlaciones

Una vez finalizados los cálculos, el informe de simulación puede contener información sobre las correlaciones entre las diferentes variables incluidas en el modelo de simulación. Se dispone de tres coeficientes de correlación diferentes:

Coeficiente de correlación de Pearson: Este coeficiente corresponde al clásico coeficiente de correlación lineal. Este coeficiente se adapta bien a los datos continuos. Su valor va de -1 a 1 y mide el grado de correlación lineal entre dos variables. Nota: el coeficiente de correlación de Pearson al cuadrado da una idea de la parte de la variabilidad de una variable que explica la otra variable. Los valores p que se calculan para cada coeficiente permiten probar la hipótesis nula de que los coeficientes no son significativamente diferentes de 0. Sin embargo, hay que ser cauteloso a la hora de interpretar estos resultados, ya que si dos variables son independientes, su coeficiente de correlación es cero, pero lo contrario no es cierto.

Coeficiente de correlación de Spearman (rho): Este coeficiente se basa en los rangos de las observaciones y no en su valor. Este coeficiente está adaptado a los datos ordinales. Al igual que la correlación de Pearson, se puede interpretar este coeficiente en términos de variabilidad explicada, pero aquí nos referimos a la variabilidad de los rangos.

Coeficiente de correlación de Kendall (tau): Al igual que el coeficiente de Spearman, se adapta bien a las variables ordinales, ya que también se basa en los rangos. Sin embargo, este coeficiente es conceptualmente muy diferente. Puede interpretarse en términos de probabilidad: es la diferencia entre las probabilidades de que las variables varíen en la misma dirección y las probabilidades de que las variables varíen en la dirección opuesta. Cuando el número de observaciones es inferior a 50 y cuando no hay empates, XLSTAT da el valor p exacto. En caso contrario, se utiliza una aproximación. Esta última se considera como fiable cuando hay más de 8 observaciones.

Análisis de sensibilidad

El análisis de sensibilidad muestra información sobre el impacto de las diferentes variables de entrada en una variable de salida. A partir de los resultados de la simulación y del coeficiente de correlación elegido (véase más arriba), se calculan las correlaciones entre las variables aleatorias de entrada y las variables de resultado y se muestran en un orden decreciente de impacto sobre la variable de resultado.

Análisis de tornado y araña

Los análisis tornado y araña no se basan en las iteraciones de la simulación, sino en un análisis punto por punto de todas las variables de entrada (variables aleatorias con distribuciones y variables de escenario).

Durante el análisis tornado, para cada variable de resultado, se estudian una a una cada variable aleatoria de entrada y cada variable de escenario. Hacemos que su valor varíe entre dos límites y registramos el valor de la variable de resultado para saber cómo afecta cada variable aleatoria y de escenario a las variables de resultado. Para una variable aleatoria, los valores explorados pueden estar en torno a la mediana o en torno al valor de la celda por defecto, con límites definidos por percentiles o desviación. Para una variable de escenario, el análisis se realiza entre dos límites especificados al definir las variables. El número de puntos es una opción que puede modificar el usuario antes de ejecutar el modelo de simulación.

El análisis de la araña no sólo muestra el cambio máximo y mínimo de la variable de resultado, sino también el valor de la variable de resultado para cada punto de datos de las variables aleatoria y de escenario. Esto es útil para comprobar si la dependencia entre las variables de distribución y las variables de resultado es monótona o no.

¿Qué gráficos se muestran para una simulación de Monte Carlo en XLSTAT?

Los siguientes gráficos están disponibles para mostrar información sobre las variables:

  • Gráficos de caja: Estas representaciones univariantes de muestras de datos cuantitativos se denominan a veces "diagramas de caja y bigotes". Se trata de una representación sencilla y bastante completa, ya que en la versión proporcionada por XLSTAT se muestran el mínimo, el 1er cuartil, la mediana, la media y el 3er cuartil, junto con los dos límites (los extremos de los "bigotes") más allá de los cuales los valores se consideran anómalos. La media se muestra con un + rojo, y una línea negra corresponde a la mediana.
  • Gramas de dispersión: Estas representaciones univariantes dan una idea de la distribución y de la posible pluralidad de las modalidades de una muestra. Todos los puntos se representan junto con la media y la mediana.
  • Gráficos P-P (distribución normal): Los gráficos P-P (Probabilidad-Probabilidad) se utilizan para comparar la función de distribución empírica de una muestra con la de una variable normal para la misma media y desviación. Si la muestra sigue una distribución normal, los datos se situarán a lo largo de la primera bisectriz del plano.
  • Gráficos Q-Q (distribución normal): Los gráficos Q-Q (Quantile-Quantile) se utilizan para comparar las cantidades de la muestra con las de una variable normal para la misma media y desviación. Si la muestra sigue una distribución normal, los datos se situarán a lo largo de la primera bisectriz del plano.
ternary diagramneural network diagram

analice sus datos con xlstat

prueba gratuita de 14 días