También me queda la duda porque el profesor no uso los valores hallados en la matriz de correlación para el min_samples_split y el min_samples_leaf, se supone que lo correcto era usar los hallados
También me queda la duda porque el profesor no uso los valores hallados en la matriz de correlación para el min_samples_split y el min_samples_leaf, se supone que lo correcto era usar los hallados
Hola Jorge, tu pregunta es súper válida. El profesor no utilizó los valores hallados en la matriz de correlación para el min_samples_split y el min_samples_leaf en el GridSearchCV, porque estos valores son hiperparámetros del modelo, que deben ser optimizados para obtener el mejor rendimiento del modelo.
La matriz de correlación puede ayudar a entender la relación entre las diferentes características, pero no proporciona información directa sobre los mejores valores para los hiperparámetros del modelo.
En el caso del GridSearchCV, se define un rango de valores para cada hiperparámetro y el GridSearchCV realiza una búsqueda exhaustiva a través de todas las combinaciones posibles de estos valores para encontrar la combinación que produce el mejor rendimiento del modelo. El GridSearchCV luego entrena el modelo con cada combinación posible de estos valores y selecciona la combinación que produce el mejor rendimiento del modelo.
Por lo tanto, aunque los valores de la matriz de correlación pueden proporcionar información útil sobre las relaciones entre las características, no proporcionan información directa sobre los mejores valores para los hiperparámetros del modelo. :)
Continúa estudiando! Machine Learning es un mar de nuevos conocimientos y aprendemos dia a dia <3
Abrazo y buenos estudios!
Si este post te ayudó, por favor, marca como solucionado ✓.