Hola, Rocio, espero que estés bien
Parece que estás trabajando en la selección de modelos de regresión lineal para predecir el precio de habitaciones de hotel. Vamos a analizar lo que tienes:
Análisis Inicial con PairPlot:
- El PairPlot muestra las relaciones entre las variables. Observa que hay una relación negativa entre "ProximidadeTurismo" y "Preço", y una relación positiva entre "Estrelas" y "Preço". Esto sugiere que a medida que los hoteles están más cerca de puntos turísticos, el precio puede disminuir, mientras que más estrellas pueden aumentar el precio.
Modelo 1 - Solo 'Estrelas':
- El R-cuadrado es 0.161, lo que indica que el modelo explica el 16.1% de la variabilidad en el precio. Esto es bastante bajo, sugiriendo que "Estrelas" por sí sola no es un buen predictor del precio.
Modelo 2 - 'Estrelas' y 'ProximidadeTurismo':
- El R-cuadrado aumenta a 0.650, lo que significa que este modelo explica el 65% de la variabilidad en el precio. La inclusión de "ProximidadeTurismo" mejora significativamente el modelo.
Recomendación:
- El Modelo 2 es claramente mejor que el Modelo 1 en términos de capacidad explicativa. Considera seguir explorando otras variables o combinaciones de variables para ver si puedes mejorar aún más el modelo.
- También podrías considerar la normalización de las variables o la inclusión de interacciones si es relevante para tu análisis.
Espero que esto te ayude a avanzar en tu proyecto. ¡Bons estudios!