1
respuesta

[Duda] Stratify

Buenas a todos:

En el ejercicio, luego de utilizar el stratify, las muestras cambiaron: 74 para entrenamiento y 25 para prueba

¿El stratify regula la cantidad de muestras de entrenamiento y de prueba para que las proporciones sean relativamente iguales?

1 respuesta

¡Hola Camila!

El parámetro "stratify" se utiliza para mantener la proporción de las clases en los conjuntos de entrenamiento y prueba.

En el contexto del ejercicio, se puede ver que inicialmente se dividió el conjunto de datos en 74 muestras para entrenamiento y 25 muestras para prueba. Sin embargo, al utilizar "stratify", las proporciones de las clases se mantienen en ambos conjuntos.

Por ejemplo, si tienes un conjunto de datos con 100 muestras y la clase positiva representa el 30% del total, al utilizar "stratify", el conjunto de entrenamiento y el conjunto de prueba también tendrán una proporción similar de la clase positiva.

Esto es útil porque asegura que el modelo se entrene y se pruebe con una distribución de clases similar, lo que puede ayudar a evitar sesgos y problemas de clasificación.

Si este post te ayudó, por favor, marca como solucionado ✓.