E n esta actividad te propongo realizar el proceso de tokenización para la columna descripcion_vecindad presente en el conjunto de datos datos_hosting.json.
datos['descripcion_vecindad'] = datos['descripcion_vecindad'].str.replace('[^a-zA-Z0-9\-\']',' ',regex=True)
datos['descripcion_vecindad'] = datos['descripcion_vecindad'].str.replace('(?<!\w)-(?!\w)', '', regex=True)
datos.head()
datos['descripcion_vecindad'] = datos['descripcion_vecindad'].str.lower()
datos['descripcion_vecindad'] = datos['descripcion_vecindad'].str.split(' ')
datos.head()