Ya estoy inscrito ¿Todavía no tienes acceso? Nuestros Planes
Ya estoy inscrito ¿Todavía no tienes acceso? Nuestros Planes
Solucionado (ver solución)
Solucionado
(ver solución)
1
respuesta

[Duda] No se tuvo en cuenta a João en la solución propuesta

Que es esto? bug? o duda?.. En el Proyecto Desafío 1: Ventas Online, la solución propuesta al parecer no contempla que en los datos hay un cliente llamado "JOãO", por lo que al aplicar la transformación, no queda "joao", sino "jo o".. afortunadamente las "marias" no tenían tilde en la i o quedarían "mar as".. se entiende que hay que "mejorar" la expresión regular (porque creo que no se menciona que "a-z" se refiere al alfabeto ingles y no incluye la ñ por ejemplo), pero... que es mejor a futuro para el análisis o la tokenización o no se...

Reemplazar las vocales con acentos por unas sin acentos? Permitir los acentos? y la cedilla? la incluimos con la eñe para que vayan de la manita?

1 respuesta
solución!

Hola, cómo va? como buenas prácticas en python, siempre es necesário hacer una limpieza y tranformación de datos donde no incluyan cualquier tipo de acento. Por ejemplo, puedes utilizar expresiones regulares para reemplazar las vocales con acentos por aquellas sin acentos.

import pandas as pd

# Suponiendo que df es tu DataFrame y 'Cliente' es la columna que quieres transformar
df['Cliente'] = df['Cliente'].str.normalize('NFKD').str.encode('ascii', errors='ignore').str.decode('utf-8').str.lower()

En este ejemplo, estamos utilizando el método str.normalize('NFKD').str.encode('ascii', errors='ignore').str.decode('utf-8') para eliminar los acentos y caracteres especiales del texto en la columna 'Cliente' y luego convertimos todo a minúsculas con str.lower().

Abrazos ;)

Si este post te ayudó, por favor, marca como solucionado ✓.