Como persona Científica de Datos, estás a cargo del análisis del problema de fijación de precios de habitaciones de hoteles, utilizando el conjunto de datos proporcionado. Para ello, dispones de este dataset.
En esta actividad, tu tarea consiste en llevar a cabo las siguientes etapas:
análisis inicial con el PairPlot de Seaborn; construir modelos de regresión lineal; y realizar la comparación de estos modelos. Dedica tiempo a las actividades y desarrolla tus habilidades a través de la aplicación de tus conocimientos adquiridos a lo largo del curso.
import pandas as pd
datos = pd.read_csv('/content/hoteis.csv')
datos.head()
import seaborn as sns
sns.pairplot(datos)
import statsmodels.api as sm
X1 = datos[['Estrelas']]
X1 = sm.add_constant(X1)
y = datos['Preco']
modelo1 = sm.OLS(y, X1).fit()
X2 = datos[['Estrelas', 'ProximidadeTurismo']]
X2 = sm.add_constant(X2)
modelo2 = sm.OLS(y, X2).fit()
X3 = datos[['Estrelas', 'ProximidadeTurismo', 'Capacidade']]
X3 = sm.add_constant(X3)
modelo3 = sm.OLS(y, X3).fit()
print("Modelo 1")
print(modelo1.summary())
print("\nModelo 2")
print(modelo2.summary())
print("\nModelo 3")
print(modelo3.summary())