Ya estoy inscrito ¿Todavía no tienes acceso? Nuestros Planes
Ya estoy inscrito ¿Todavía no tienes acceso? Nuestros Planes
1
respuesta

Lo que aprendimos

Gracias por la clase. Estoy aprendiendo y me pareció muy útil practicar cómo manipular textos en un DataFrame, usar regex para limpiar caracteres y finalmente transformar las frases en listas de palabras listas para analizar.

1 respuesta

¡Hola Estudiante, espero que estés bien!

Me alegra saber que estás disfrutando de la clase y que te ha resultado útil. Manipular textos en un DataFrame y usar regex son habilidades muy valiosas cuando trabajas con datos textuales.

Un ejemplo práctico de cómo podrías aplicar lo que has aprendido es limpiar una columna de texto en un DataFrame. Supongamos que tienes una columna con frases y deseas eliminar caracteres especiales y luego dividir las frases en palabras individuales. Podrías hacer algo como esto:

import pandas as pd
import re

# Crear un DataFrame de ejemplo
data = {'frases': ['Hola, ¿cómo estás?', '¡Esto es un ejemplo!', 'Aprender Pandas es genial.']}
df = pd.DataFrame(data)

# Definir una función para limpiar y tokenizar el texto
def limpiar_y_tokenizar(texto):
    texto_limpio = re.sub(r'[^\w\s]', '', texto)  # Eliminar caracteres especiales
    palabras = texto_limpio.split()  # Dividir en palabras
    return palabras

# Aplicar la función a la columna del DataFrame
df['palabras'] = df['frases'].apply(limpiar_y_tokenizar)

print(df)

Esto te dará un DataFrame donde cada frase ha sido limpiada de caracteres especiales y convertida en una lista de palabras. Espero que este ejemplo te sea de ayuda para seguir practicando y aplicando lo que has aprendido.

¡Espero haber ayudado y buenos estudios!