Pregunta:
No soy un experto en bosques aleatorios, pero entiendo claramente que el problema clave con los bosques aleatorios es la generación (aleatoria) de árboles. ¿Puedes explicarme cómo se generan los árboles? (es decir, ¿cuál es la distribución utilizada para la generación de árboles?)
Gracias por adelantado !
Respuesta:
Las implementaciones de RF difieren ligeramente. Sé que se supone que la implementación patentada de Salford Systems es mejor que la de vainilla en R. Una descripción del algoritmo está en ESL por Friedman-Hastie-Tibshirani, 2ª edición, 3ª impresión . Se dedica un capítulo entero (15º) a RF, y lo encuentro más claro que el artículo original. El algoritmo de construcción de árboles se detalla en la p.588; no es necesario que lo reproduzca aquí, ya que el libro está disponible en línea.