Ya estoy inscrito ¿Todavía no tienes acceso? Nuestros Planes
Ya estoy inscrito ¿Todavía no tienes acceso? Nuestros Planes
1
respuesta

error al importar toktokenizer

Buenso dias estoy intentando replicar el cuaderno del corrector ortografico pero tengo el siguiente error

cannot import name 'toktokenizer' from 'nltk.tokenize.toktok'

1 respuesta

Hola Jairo, cómo va?

Por lo que entendi, estás intentando utilizar el módulo 'toktokenizer' para la tokenización en español, pero estás teniendo problemas con el módulo NLTK.

Una posible solución para tu problema sería utilizar el módulo 'toktok' de NLTK para la tokenización en español. Aquí tienes un ejemplo de cómo podrías hacerlo:

import nltk
from nltk.tokenize.toktok import ToktokTokenizer

# Crear un objeto ToktokTokenizer
toktok = ToktokTokenizer()

# Tokenizar un texto de ejemplo
texto_ejemplo = "hola, Christian, ¿qué tal?"
palabras_separadas = toktok.tokenize(texto_ejemplo)

# Imprimir las palabras separadas
print(palabras_separadas)

Al utilizar el módulo 'toktok' de NLTK, deberías poder tokenizar correctamente el texto en español, incluyendo la separación de signos de interrogación y otros caracteres especiales. ;)

Si este post te ayudó, por favor, marca como solucionado ✓.