Ya estoy inscrito ¿Todavía no tienes acceso? Nuestros Planes
Ya estoy inscrito ¿Todavía no tienes acceso? Nuestros Planes
1
respuesta

Desafío: trabajando en otros contextos

Proyecto Desafío 1: Ventas Online Leímos la base de datos en el desafío anterior, ahora podemos seguir adelante con la transformación de estos datos. Así, el nuevo desafío del proyecto 1 será dividido en algunas metas:

Eliminar datos en listas dentro del DataFrame; Verificar tipos de datos; Identificar columnas numéricas; Transformar la columna numérica a tipo numérico.

columnas = list(datos.columns)
columnas
datos = datos.explode(columnas[1:])
datos.reset_index(drop=True,inplace=True)
datos
datos.info()
datos['Valor da compra']
datos['Valor da compra'] = datos['Valor da compra'].apply(lambda x: x.replace('R$ ', '').replace(',','.').strip())
datos['Valor da compra'] = datos['Valor da compra'].astype(np.float64)
datos.info(

Proyecto Desafío 2: Administración de Condominios Leímos la base de datos en el desafío anterior, ahora podemos seguir adelante con la transformación de estos datos. Entonces, de la misma manera que en el proyecto 1, el desafío del proyecto 2 está listado en algunas metas:

Eliminar datos en listas dentro del DataFrame; Verificar tipos de datos; Identificar columnas numéricas; Transformar la columna numérica a tipo numérico.

columnas = list(datos2.columns)
columnas
datos2 = datos2.explode(columnas[1:])
datos2.reset_index(drop=True,inplace=True)
datos2
datos2.info()
datos2['valor_aluguel']
datos2['valor_aluguel'] = datos2['valor_aluguel'].apply(lambda x: x.replace('$ ', '').replace(' reais', '').replace(',','.').strip())
datos2['valor_aluguel'] = datos2['valor_aluguel'].astype(np.float64)
datos2.info()
1 respuesta

¡Hola Paul!

Parece que estás trabajando en la transformación de datos para dos proyectos diferentes, y ya has avanzado bastante en ambos. Vamos a revisar lo que has hecho y ver cómo podemos asegurarnos de que todo esté funcionando como esperas.

Para el Proyecto Desafío 1: Ventas Online, has comenzado eliminando listas dentro del DataFrame usando explode, lo cual es una buena manera de aplanar listas en tus columnas. Luego, verificaste los tipos de datos y transformaste la columna 'Valor da compra' a un tipo numérico. El uso de apply junto con replace es una técnica común para limpiar los datos antes de convertirlos a float64. Parece que todo está bien aquí.

Para el Proyecto Desafío 2: Administración de Condominios, seguiste un proceso similar. Usaste explode para aplanar listas, y luego transformaste la columna 'valor_aluguel' a un tipo numérico. Nuevamente, el uso de apply y replace es adecuado para limpiar los datos antes de la conversión.

Aquí hay algunos consejos adicionales que podrían ayudarte:

  1. Verificación de errores: Asegúrate de que tus datos no contengan valores nulos o cadenas vacías antes de la conversión. Puedes usar dropna() o fillna() para manejar valores nulos.

  2. Validación de datos: Después de la conversión, es útil verificar si los valores están dentro de un rango esperado. Por ejemplo, puedes usar describe() para obtener un resumen estadístico de tus columnas numéricas.

  3. Documentación: Mantén un registro de los cambios que realizas en tus datos. Esto te ayudará a entender el proceso y a depurar cualquier problema que pueda surgir más adelante.

Espero que estos consejos te sean útiles para continuar con tus proyectos. ¡Sigue adelante con el buen trabajo!

Espero haber ayudado y buenos estudios!

Si este post te ayudó, por favor, marca como solucionado ✓. Continúa con tus estudios!