Desafío: hazlo tú mismo

Bryan Roboan Mejia Garcia · 2025-12-02 17:09

**En este ejercicio cargué el archivo datos_hosting.json, normalicé la columna info_inmuebles y apliqué la tokenización. Descubrí que descripcion_vecindad está vacía en todos los registros, pero en d

¡Hola Estudiante, espero que estés bien!

Parece que ya has hecho un gran trabajo normalizando y tokenizando la columna descripcion_local. Ahora, para la columna descripcion_vecindad, aunque mencionas que está vacía en todos los registros, podrías intentar el mismo proceso para asegurarte de que no haya datos ocultos o formateados de manera diferente que puedan ser procesados.

Aquí tienes un ejemplo de cómo podrías hacerlo:

# Asegúrate de que los valores nulos sean reemplazados por una cadena vacía
datos['descripcion_vecindad'] = datos['descripcion_vecindad'].fillna("").astype(str).str.lower()

# Elimina caracteres no deseados usando expresiones regulares
datos['descripcion_vecindad'] = datos['descripcion_vecindad'].str.replace(r"[^a-zA-Z0-9\s]", " ", regex=True)

# Divide el texto en listas de palabras
datos['descripcion_vecindad'] = datos['descripcion_vecindad'].str.split()

# Muestra los primeros registros para verificar
print(datos[['descripcion_vecindad']].head())

Si después de esto la columna sigue vacía, entonces es posible que realmente no haya datos útiles en ella. Sin embargo, este proceso te ayudará a confirmar que no hay información procesable.

Espero que esto te ayude y buenos estudios!

Trilhas por carreira

Carreiras de IA

Carreiras de Dados

Carreiras de Cyber

Carreiras de DevOps & Cloud

Carreiras de UX & UI

Carreiras de Mobile & Front-End

Carreiras de Back-End

Carreiras de Negócios

Cursos universitários FIAP

Tópicos relacionados

Contenidos de Alura sobre el tema