simulation – ¿Se puede confiar en MCMC adaptativa?

Pregunta:

Estoy leyendo sobre MCMC adaptativa (ver, por ejemplo, el Capítulo 4 del Manual de Markov Chain Monte Carlo , ed. Brooks et al., 2011; y también Andrieu & Thoms, 2008 ).

El principal resultado de Roberts y Rosenthal (2007) es que si el esquema de adaptación satisface la condición de adaptación que desaparece (más algún otro tecnicismo), la MCMC adaptativa es ergódica bajo cualquier esquema. Por ejemplo, la adaptación de fuga se puede obtener fácilmente adaptando el operador de transición en la iteración $ n $ con probabilidad $ p (n) $ , con $ \ lim_ {n \ rightarrow \ infty} p (n) = 0 $ .

Este resultado es (a posteriori) intuitivo, asintóticamente. Dado que la cantidad de adaptación tiende a cero, eventualmente no se estropeará con la ergodicidad. Mi preocupación es qué sucede con el tiempo finito .

  • ¿Cómo sabemos que la adaptación no está alterando la ergodicidad en un tiempo finito dado, y que un muestreador está tomando muestras de la distribución correcta? Si tiene algún sentido, ¿cuánto debe hacerse para asegurarse de que la adaptación temprana no sesgue las cadenas?

  • ¿Los profesionales en el campo confían en MCMC adaptativo? La razón por la que pregunto es porque he visto muchos métodos recientes que intentan incorporar la adaptación en otras formas más complejas que se sabe que respetan la ergodicidad, como la regeneración o los métodos de conjunto (es decir, es legítimo elegir una transición operador que depende del estado de otras cadenas paralelas). Alternativamente, la adaptación se realiza solo durante el quemado, como en Stan , pero no en tiempo de ejecución. Todos estos esfuerzos me sugieren que la MCMC adaptativa según Roberts y Rosenthal (que sería increíblemente simple de implementar) no se considera confiable; pero quizás haya otras razones.

  • ¿Qué pasa con las implementaciones específicas, como el adaptativo Metropolis-Hastings ( Haario et al. 2001 )?


Referencias

Respuesta:

¿Cómo sabemos que la adaptación no está alterando la ergodicidad en un tiempo finito dado, y que un muestreador está tomando muestras de la distribución correcta? Si tiene algún sentido, ¿cuánto debe hacerse para asegurarse de que la adaptación temprana no sesgue las cadenas?

La ergodicidad y el sesgo tienen que ver con las propiedades asintóticas de la cadena de Markov, no dicen nada sobre el comportamiento y la distribución de la cadena de Markov at a given finite time . La adaptabilidad no tiene nada que ver con este problema, cualquier algoritmo MCMC puede producir simulaciones lejos del objetivo at a given finite time .

Leave a Comment

Your email address will not be published. Required fields are marked *

Scroll to Top

web tasarım