Me vendría bien algún articulo que hable con más profundidad de como funciona SKLearn, o frases clave para buscarlo por mi cuenta. No hay problema si es matemática pesada, ya que más o menos la domino. Gracias.
Me vendría bien algún articulo que hable con más profundidad de como funciona SKLearn, o frases clave para buscarlo por mi cuenta. No hay problema si es matemática pesada, ya que más o menos la domino. Gracias.
Hola Leonardo,
La semilla (SEED) es un número que se utiliza como punto de partida para generar una secuencia de números aleatorios. Si utilizas la misma semilla, obtendrás la misma secuencia de números aleatorios. Esto es útil en ciencia de datos y machine learning porque a menudo necesitamos reproducir nuestros experimentos y obtener los mismos resultados, y eso sería imposible si los números aleatorios cambian todo el tiempo.
En el caso de la biblioteca SKLearn, la semilla se utiliza en varias funciones y métodos que implican aleatoriedad. Por ejemplo, en el método GridSearchCV que estás utilizando, la semilla podría ser utilizada para determinar cómo se dividen los datos en diferentes conjuntos para la validación cruzada, o cómo se inicializan los pesos en un algoritmo de aprendizaje.
En tu caso, la semilla se está utilizando para generar números aleatorios en NumPy. En el código, se ve algo como esto:
np.random.seed(301)
Esto significa que cualquier número aleatorio que se genere después de establecer la semilla será parte de una secuencia específica determinada por esa semilla (301 en este caso). Si ejecutas el código varias veces, siempre obtendrás la misma secuencia de números aleatorios.
En cuanto a aprender más sobre cómo funciona SKLearn, te recomendaría que leas la documentación oficial de SKLearn. Es muy completa y tiene muchos ejemplos. Aquí está el enlace: https://scikit-learn.org/stable/
Un abrazo y buenos estudios!
Si este post te ayudó, por favor, marca como solucionado ✓.