Ya estoy inscrito ¿Todavía no tienes acceso? Nuestros Planes
Ya estoy inscrito ¿Todavía no tienes acceso? Nuestros Planes
1
respuesta

Audios en otro idioma

Yo tuve un error, pero corre bien el programa. El detalle no sé si es porque el audio que adjunté esta en Occitan, o si simplemente puse mal el código:

model = whisper.load_model("small")
result = model.transcribe("/content/occitan.mp3") #subir archivo antes en google colab
print(result["text"])

Olvidenlo hehehe, ya al estar dejando mi duda ví que si funcionó, pero como no es un idioma conocido, no sabe interpretarlo muy bien y me arroja un popurri de letras latinas intentando interpretar el sonido. Muy genial esta experiencia.

1 respuesta

¡Hola Angel, espero que estés bien!

Me alegra que hayas podido resolver tu duda por ti mismo. Trabajar con audios en idiomas menos comunes puede ser un desafío, ya que los modelos de transcripción como Whisper están entrenados principalmente en idiomas más populares. Esto puede llevar a resultados menos precisos cuando se trata de idiomas como el occitano.

Una posible solución para mejorar la transcripción en idiomas menos comunes es experimentar con diferentes modelos de Whisper. Aunque mencionaste que estás usando el modelo "small", podrías intentar con modelos más grandes como "medium" o "large", que podrían tener una mejor capacidad para manejar una variedad más amplia de idiomas.

Aquí tienes un ejemplo de cómo podrías cambiar el modelo:

model = whisper.load_model("medium")  # Cambia "small" por "medium" o "large"
result = model.transcribe("/content/occitan.mp3")
print(result["text"])

Recuerda que los modelos más grandes pueden requerir más recursos de cómputo, así que ten esto en cuenta si decides probarlos.

Espero que sigas disfrutando de tus experimentos con la transcripción de audio. ¡Es una herramienta realmente poderosa!

Espero haber ayudado y buenos estudios!