La clase esta muy interesante, pero siento que ella lo hace enredar a uno, primero se debio correr el diccionario de sexo y color
La clase esta muy interesante, pero siento que ella lo hace enredar a uno, primero se debio correr el diccionario de sexo y color
Hola Jeisson, espero que estés bien
¡Qué bueno que estás disfrutando de la clase! Entiendo que puede ser un poco confuso al principio, especialmente cuando se trata de seguir el flujo de trabajo en Python. La sugerencia de correr el diccionario de sexo y color primero es muy válida, ya que ayuda a clarificar los datos que estamos manejando desde el principio.
En la clase, se está utilizando la función ValueCounts para contar las frecuencias de las variables cualitativas, como el sexo. Si sientes que sería más claro correr primero el diccionario, puedes hacerlo de la siguiente manera:
Definir el diccionario: Antes de comenzar con el análisis, puedes definir un diccionario que mapee los valores numéricos a sus correspondientes categorías. Por ejemplo:
sexo_dict = {0: 'Masculino', 1: 'Femenino'}
color_dict = {0: 'Indígena', 1: 'Blanco', 2: 'Negro', 3: 'Amarillo', 4: 'Pardo'}
Aplicar el diccionario: Luego, puedes usar el método replace de pandas para aplicar este diccionario a tu DataFrame y así trabajar directamente con los nombres de las categorías en lugar de los números:
datos['Sexo'] = datos['Sexo'].replace(sexo_dict)
datos['Color'] = datos['Color'].replace(color_dict)
Esto puede facilitar la comprensión de los datos y el análisis posterior, ya que estarás viendo las categorías con sus nombres en lugar de números.
Espero que esta sugerencia te ayude a seguir mejor las clases y a sentirte más cómodo con el material. ¡Bons estudios!