Buenas tardes para todos.
En el video el profesor define un SEED = 42, esta cifra como se calcula es con base a que criterios. Agradezco mucho su ayuda, ya que no es claro aún para mi este valor.
Buenas tardes para todos.
En el video el profesor define un SEED = 42, esta cifra como se calcula es con base a que criterios. Agradezco mucho su ayuda, ya que no es claro aún para mi este valor.
¡Hola!
El parámetro random_state
se utiliza para establecer la semilla (seed) en la generación de números aleatorios. Esto es útil cuando se trabaja con algoritmos que tienen componentes aleatorios, como el caso de la separación de datos en conjuntos de entrenamiento y prueba.
Cuando se establece un valor específico para random_state
, el algoritmo generará los mismos números aleatorios cada vez que se ejecute. Esto es útil para garantizar que los resultados sean replicables.
En el ejemplo que mencionas, el valor 42
se eligió arbitrariamente como semilla. No hay un criterio específico para elegir este valor, simplemente se seleccionó para ilustrar cómo funciona el parámetro random_state
.
Si deseas cambiar el valor de random_state
a 99
, puedes hacerlo de la siguiente manera:
SEED = 99
x_train, x_test, y_train, y_test = train_test_split(x, y, test_size=0.25, random_state=SEED)
model = LinearSVC()
model.fit(x_train, y_train)
previsiones = model.predict(x_test)
tasa_de_acierto = accuracy_score(y_test, previsiones)
print(f'La tasa de acierto fue de: {round(tasa_de_acierto*100,2)}%')
Recuerda que el valor de random_state
puede ser cualquier número entero. No hay un valor específico que debas utilizar, simplemente asegúrate de que sea el mismo en todas las ejecuciones si deseas resultados consistentes.
Espero haber resuelto tu duda. ¡Buenos estudios!