2
respuestas

[Duda] Parámetro stratify

Al agregar el parámetro stratify la tasa de acierto fue del 100%, alguien sabe a que se debe

Ingrese aquí la descripción de esta imagen para ayudar con la accesibilidad

Sin el parámetro Ingrese aquí la descripción de esta imagen para ayudar con la accesibilidad

2 respuestas

Hola Carlos , espero que estés muy bien.

El parámetro stratify es utilizado en algunos algoritmos de aprendizado de máquina para asegurarse de que as amostras usadas para treinamento e teste sejam proporcionais em relação a alguma variável categórica.

Assim, ao usar stratify, o algoritmo será treinado e testado com uma amostra que representa adequadamente a proporção de categorias na variável alvo, o que pode levar a uma melhor generalização e, portanto, uma maior taxa de acerto.

Un saludo.

Si este post te ayudó, por favor, marca como solucionado ✓. Continúa con tus estudios

Hola Carlos, hola Ingrid, pienso es por el parametro random_state, lo pusiste al 1, no se bien que significa un estado aleatorio de 1 pero si lo subis por ejemplo a 25 ya varia y si lo dejas en 42 como es el caso tambien queda en 96% y si lo llevas al 99 queda en 92% la tasa de acierto, al ser tan poco aleatorio no queda margen para probar en mas datos?

SEED = 42

x_train, x_test, y_train, y_test = train_test_split(x,y,test_size=0.25,random_state=SEED, stratify=y)

les mando un caluroso saludo y garcias por el hilo.