Ya estoy inscrito ¿Todavía no tienes acceso? Nuestros Planes
Ya estoy inscrito ¿Todavía no tienes acceso? Nuestros Planes
2
respuestas

Regresion Lineal con Scikit-Learn - Prediccion puntual

Hola!

Mi duda es sobre la prediccion puntual que obtiene el profesor en la clase 5, video "Obteniendo predicciones puntuales". Al usar el metodo predict, él obtiene un resultado de 295543.350774717, sin embargo, si nos vamos al dato y de la base test (y_test[0:1]), el valor luego de tranformar el logaritmo es 702403. Mi consulta es ¿porque es tanta la diferencia? En todo caso se debe señalar que la predicción no fue buena.

Si nos vamos a la observacion de la base de datos, se puede corroborar el valor original de 702403 Observacion 1006 de la base de de datos

2 respuestas

¡Hola!

La diferencia que observas entre la predicción y el valor real puede deberse a varios factores. Aquí te dejo algunas posibles razones:

  1. Transformación Logarítmica: Si el modelo fue entrenado con datos transformados logarítmicamente, asegúrate de que la predicción también se transforme de vuelta a su escala original. Si el modelo predice en la escala logarítmica, necesitarás aplicar la función exponencial para obtener el valor real.

  2. Sobreajuste o Subajuste: El modelo podría estar sobreajustado o subajustado. Revisa el ajuste del modelo y considera ajustar los hiperparámetros o usar más datos de entrenamiento.

  3. Errores en los Datos: Verifica si hay errores en los datos de entrada o si se usaron las características correctas para la predicción.

  4. Varianza en los Datos: A veces, la varianza en los datos puede hacer que las predicciones sean menos precisas para ciertos puntos de datos.

Revisa estos puntos y asegúrate de que el flujo de datos y transformaciones sea consistente. Espero que esto te ayude a identificar la causa de la discrepancia.

Espero haber ayudado y buenos estudios!

Si este post te ayudó, por favor, marca como solucionado ✓. Continúa con tus estudios!

Hola Ingrid,

Gracias por tu respuesta.

Con respecto a las opciones que pones, no aplica a ninguna debido a que se puede replicar el ejemplo con los datos del profesor y obtener el resultado que expongo, entonces el problema no va por el lado del modelo, que es el mismo entrenado por el profesor.