regression – ¿Cómo interpretar los coeficientes de regresión cuando la respuesta fue transformada por la cuarta raíz?

Pregunta:

Estoy usando la transformación de potencia de cuarta raíz ( 1/4 ) en mi variable de respuesta, como resultado de la heterocedasticidad. Pero ahora no estoy seguro de cómo interpretar mis coeficientes de regresión.

Supongo que necesitaría llevar los coeficientes a la cuarta potencia cuando realizo una transformación inversa (consulte la salida de regresión a continuación). Todas las variables están en unidades de dólares en millones, pero me gustaría saber el cambio en dólares en miles de millones.

Mientras se mantiene constante la otra variable independiente, un cambio de mil millones de dólares en las tarifas, en promedio, conduce a un cambio de 32 (o 32.000 dólares) en las cobranzas. Tomo 0.000075223 * 1000 (para llegar a miles de millones) ^ 4 = 0.000032 . Ahora, ¿multiplico este número por 1 millón o mil millones (la unidad original de la variable dependiente está en millones)?

lm(formula = (Collections^(1/4)) ~ Fees + DIR)

                 Estimate      Std. Error  t value            Pr(>|t|)
(Intercept)   2.094573355     0.112292375   18.653  0.0000000000000151
Fees        **0.000075223   **0.000008411    8.943  0.0000000131878713
DIR           0.000022279     0.000004107    5.425  0.0000221138881913

Respuesta:

La mejor solución es, al principio, elegir una reexpresión que tenga sentido en el campo de estudio.

(Por ejemplo, al hacer una regresión del peso corporal frente a factores independientes, es probable que se indique una raíz cúbica ($ 1/3 $ potencia) o una raíz cuadrada ($ 1/2 $ potencia). Teniendo en cuenta que el peso es un buen indicador del volumen, la raíz cúbica es una longitud que representa un tamaño lineal característico. Esto le confiere un significado intuitivo y potencialmente interpretable. Aunque la raíz cuadrada en sí no tiene una interpretación tan clara, está cerca de la potencia de $ 2/3 $, que tiene dimensiones de superficie área : podría corresponder al área total de la piel.)

La cuarta potencia está lo suficientemente cerca del logaritmo que debería considerar usar el registro en su lugar , cuyos significados se comprenden bien. Pero a veces realmente encontramos que una raíz cúbica o una raíz cuadrada o alguna potencia fraccionaria hace un gran trabajo y no tiene una interpretación obvia. Entonces, debemos hacer un poco de aritmética.

El modelo de regresión que se muestra en la pregunta involucra una variable dependiente $ Y $ ("Cobros") y dos variables independientes $ X_1 $ ("Tarifas") y $ X_2 $ ("DIR"). Postula que

$$ Y ^ {1/4} = \ beta_0 + \ beta_1 X_1 + \ beta_2 X_2 + \ varepsilon. $$

El código estima $ \ beta_0 $ como $ b_0 = 2.094573355 $, $ \ beta_1 $ como $ b_1 = 0.000075223 $ y $ \ beta_2 $ como $ b_2 = 0.000022279 $. También supone que $ \ varepsilon $ son iid normales con media cero y estima su varianza común (no se muestra). Con estas estimaciones, el valor ajustado de $ Y ^ {1/4} $ es

$$ \ widehat {Y ^ {1/4}} = b_0 + b_1 X_1 + b_2 X_2. $$

"Interpretar" los coeficientes de regresión normalmente significa determinar qué cambio en la variable dependiente sugiere un cambio dado en cada variable independiente. Estos cambios son las derivadas $ dY / dX_i $, que la regla de la cadena nos dice que son iguales a $ 4 \ beta_iY ^ 3 $. Enchufaríamos las estimaciones, entonces, y diríamos algo como

La regresión estima que un cambio de unidad en $ X_i $ estará asociado con un cambio en $ Y $ de $ 4b_i \ widehat {Y} ^ 3 $ = $ 4b_i \ left (b_0 + b_1X_1 + b_2X_2 \ right) ^ 3 $.

La dependencia de la interpretación de $ X_1 $ y $ X_2 $ no se expresa simplemente en palabras, a diferencia de las situaciones sin transformación de $ Y $ (un cambio de unidad en $ X_i $ está asociado con un cambio de $ b_i $ en $ Y $) o con el logaritmo (un cambio porcentual en $ X_i $ está asociado con un cambio porcentual de $ b_i $ en $ Y $). Sin embargo, manteniendo la primera forma de interpretación y calculando $ 4b_1 $ = $ 4 \ times 0.000075223 $ = $ 0.000301 $, podríamos decir algo como

Un cambio de unidad en las tarifas está asociado con un cambio en las colecciones de $ 0,000301 $ multiplicado por el cubo de las colecciones actuales; por ejemplo, si los cobros actuales son $ 10 $, entonces un aumento unitario en las tarifas se asocia con un aumento de $ 0,301 $ en los cobros y si los cobros actuales son $ 20 $, entonces el mismo aumento unitario en las tarifas se asocia con un aumento de $ 2,41 $ en colecciones.


Cuando eche raíces que no sean el cuarto, digamos, cuando use $ Y ^ p $ como respuesta en lugar de $ Y $ en sí, con $ p $ distinto de cero, simplemente reemplace todas las apariencias de "$ 4 $" en este análisis por "$ 1 / p $ ".

Leave a Comment

Your email address will not be published. Required fields are marked *

web tasarım