¡Hola Estudiante, espero que estés bien!
Parece que estás trabajando en la actividad "Consolidando tu conocimiento" del curso sobre técnicas avanzadas de modelado de regresión lineal. Aunque no puedo acceder directamente al enlace que compartiste, puedo ofrecerte una guía general sobre cómo abordar esta actividad.
Importar train_test_split: Asegúrate de tener la biblioteca scikit-learn instalada. Puedes importar la función con:
from sklearn.model_selection import train_test_split
Crear una Series para el precio de los inmuebles: Utiliza pandas para crear una serie que contenga los precios. Supongamos que tienes un DataFrame llamado df con una columna precio:
import pandas as pd
precios = pd.Series(df['precio'])
Crear un DataFrame para las variables explicativas: Excluye la columna de precios para crear el DataFrame de variables explicativas:
variables_explicativas = df.drop(columns=['precio'])
Crear los datasets de entrenamiento y prueba:
X_train, X_test, y_train, y_test = train_test_split(variables_explicativas, precios, test_size=0.2, random_state=42)
Importar statsmodels: Asegúrate de tener instalada la biblioteca statsmodels e impórtala:
import statsmodels.api as sm
Estimar el modelo de regresión lineal:
X_train_const = sm.add_constant(X_train) # Añadir constante para el intercepto
modelo = sm.OLS(y_train, X_train_const).fit()
Evaluar las estadísticas del modelo:
print(modelo.summary())
Modificar el modelo y evaluar el ajuste: Puedes intentar eliminar variables no significativas o transformar variables para mejorar el ajuste del modelo.
Espero que estos pasos te ayuden a avanzar en tu actividad. ¡Bons estudos!