Entrar ¿Aún no tienes acceso?

Ya estoy inscrito ¿Todavía no tienes acceso? Nuestros Planes

1
respuesta

por Jaime Alberto Loayza Vilcapuna

| 72.6k xp | 116 posts

import pandas as pd
import re

1️⃣ Leer el archivo JSON

df = pd.read_json("datos_hosting.json")

2️⃣ Limpiar el texto de la columna descripcion_vecindad

df['descripcion_vecindad_limpia'] = (
df['descripcion_vecindad']
.str.lower() # Pasar todo a minúsculas
.str.replace(r"[^a-záéíóúüñ0-9\s]", "", regex=True) # Quitar signos de puntuación y símbolos
)

3️⃣ Tokenizar (convertir en lista de palabras)

df['descripcion_vecindad_token'] = df['descripcion_vecindad_limpia'].str.split()

4️⃣ (Opcional) Eliminar stopwords en español

stopwords = set([
"de", "la", "el", "en", "y", "a", "los", "las", "un", "una", "con", "por", "para", "del", "al"
])

df['descripcion_vecindad_token'] = df['descripcion_vecindad_token'].apply(
lambda tokens: [t for t in tokens if t not in stopwords]
)

5️⃣ Ver resultado

print(df[['descripcion_vecindad', 'descripcion_vecindad_token']].head())

1 respuesta

por wilfredo antonio rojas camejo

| 401.8k xp | 1527 posts

Instructor

23/08/2025

Hola , espero que estés muy bien.

Felicitaciones por tu aprendizaje. Estamos priorizando el foro para postear dudas, así optimizamos el tiempo de respuesta para ustedes.

Para no dejar de compartir los códigos, actividades y ejercicios que realizas, creamos un canal en Discord (#compartetucodigo) donde puedes compartirlos, dar y sugerir mejoras con el resto de tus compañeros.

Un saludo.

Si este post te ayudó, por favor, marca como solucionado ✓. Continúa con tus estudios

Desafío: hazlo tú mismo

1️⃣ Leer el archivo JSON

2️⃣ Limpiar el texto de la columna descripcion_vecindad

3️⃣ Tokenizar (convertir en lista de palabras)

4️⃣ (Opcional) Eliminar stopwords en español

5️⃣ Ver resultado

Trilhas por carreira

Carreiras de IA

Carreiras de Dados

Carreiras de Cyber

Carreiras de DevOps & Cloud

Carreiras de UX & UI

Carreiras de Mobile & Front-End

Carreiras de Back-End

Carreiras de Negócios

Cursos universitários FIAP

1️⃣ Leer el archivo JSON

2️⃣ Limpiar el texto de la columna descripcion_vecindad

3️⃣ Tokenizar (convertir en lista de palabras)

4️⃣ (Opcional) Eliminar stopwords en español

5️⃣ Ver resultado

Tópicos relacionados

Contenidos de Alura sobre el tema

Trilhas por carreira

Carreiras de IA

Carreiras de Dados

Carreiras de Cyber

Carreiras de DevOps & Cloud

Carreiras de UX & UI

Carreiras de Mobile & Front-End

Carreiras de Back-End

Carreiras de Negócios

Cursos universitários FIAP