Usando lmer para la predicción

Pregunta:

Hola, tengo dos problemas que parecen candidatos naturales para modelos multinivel / mixtos, que nunca he usado. El más simple, y uno que espero probar como introducción, es el siguiente: Los datos se ven como muchas filas del formulario

xy innergroup outergroup

donde x es una covariable numérica sobre la que quiero hacer una regresión y (otra variable numérica), cada y pertenece a un grupo interno, y cada grupo interno está anidado en un grupo externo (es decir, todas las y en un grupo interno dado pertenecen al mismo grupo externo) . Desafortunadamente, innergroup tiene muchos niveles (muchos miles), y cada nivel tiene relativamente pocas observaciones de y, así que pensé que este tipo de modelo podría ser apropiado. Mis preguntas son

  1. ¿Cómo escribo este tipo de fórmula multinivel?

  2. Una vez que lmer se ajusta al modelo, ¿cómo se hace la predicción a partir de él? He incluido algunos ejemplos de juguetes más simples, pero no he encontrado una función de predicción (). La mayoría de la gente parece más interesada en la inferencia que en la predicción con este tipo de técnica. Tengo varios millones de filas, por lo que los cálculos pueden ser un problema, pero siempre puedo reducirlos según corresponda.

No necesitaré hacer el segundo por algún tiempo, pero también podría comenzar a pensar en ello y jugar con él. Tengo datos similares a los de antes, pero sin x, y y ahora es una variable binomial de la forma $ (n, nk) $. y también exhibe mucha sobredispersión, incluso dentro de grupos internos. La mayoría de los $ n $ no son más de 2 o 3 (o menos), por lo que para derivar estimaciones de las tasas de éxito de cada $ y_i $ he estado usando el estimador de contracción beta-binomial $ (\ alpha + k_i) / ( \ alpha + \ beta + n_i) $, donde $ \ alpha $ y $ \ beta $ son estimados por MLE para cada innergroup por separado. Esto ha sido algo adecuado, pero la escasez de datos todavía me afecta, por lo que me gustaría usar todos los datos disponibles. Desde una perspectiva, este problema es más fácil ya que no existe una covariable, pero desde la otra, la naturaleza binomial lo hace más difícil. ¿Alguien tiene alguna orientación de nivel alto (o bajo!)?

Respuesta:

La expresión de relaciones de factores usando fórmulas R se deriva de la notación de Wilkinson, donde '*' denota cruzamiento y anidación '/', pero hay algunas particularidades en la forma en que se manejan las fórmulas para modelos de efectos mixtos, o efectos más generalmente aleatorios. Por ejemplo, dos efectos aleatorios cruzados se pueden representar como (1|x1)+(1|x2) . He interpretado su descripción como un caso de anidación, al igual que las clases están anidadas en escuelas (anidadas en estados, etc.), por lo que una fórmula básica con lmer se vería así (a menos que se indique lo contrario, se usa una familia gaussian por defecto):

y ~ x + (1|A:B) + (1|A)

donde A y B corresponden a sus factores internos y externos, respectivamente. B está anidado dentro de A y ambos se tratan como factores aleatorios. En el paquete nlme más antiguo , esto correspondería a algo como lme(y ~ x, random=~ 1 | A/B) . Si A fuera a ser considerado como un factor fijo, la fórmula debería ser y ~ x + A + (1|A:B) .

Pero vale la pena verificar con más precisión las especificaciones de D. Bates para el paquete lme4 , por ejemplo, en su próximo libro de texto, lme4: Modelado de efectos mixtos con R , o los muchos folletos disponibles en la misma página web. En particular, hay un ejemplo de tales relaciones de anidamiento en Ajustar modelos lineales de efectos mixtos, el paquete lme4 en R. El tutorial de John Maindonald también proporciona una buena descripción general: La anatomía de un análisis de modelo mixto, con el paquete lme4 de R. Finalmente, la sección 3 de la viñeta R sobre la implementación de lme4 incluye un ejemplo del análisis de una estructura anidada.

No hay función de predict() en lme4 (esta función ahora existe, vea el comentario a continuación), y debe calcular usted mismo los valores individuales predichos usando los efectos fijos estimados (ver ?fixef ) y aleatorios (ver ?ranef ), pero vea también este hilo sobre la falta de función de predicción en lme4 . También puede generar una muestra a partir de la distribución posterior utilizando la función mcmcsamp() . A veces, sin embargo, podría chocar. Consulte la lista de correo sig-me para obtener información más actualizada.

Leave a Comment

Your email address will not be published.

Scroll to Top

istanbul avukat

-

web tasarım