¡Hola Angel, espero que estés bien!
Me alegra que hayas podido resolver tu duda por ti mismo. Trabajar con audios en idiomas menos comunes puede ser un desafío, ya que los modelos de transcripción como Whisper están entrenados principalmente en idiomas más populares. Esto puede llevar a resultados menos precisos cuando se trata de idiomas como el occitano.
Una posible solución para mejorar la transcripción en idiomas menos comunes es experimentar con diferentes modelos de Whisper. Aunque mencionaste que estás usando el modelo "small", podrías intentar con modelos más grandes como "medium" o "large", que podrían tener una mejor capacidad para manejar una variedad más amplia de idiomas.
Aquí tienes un ejemplo de cómo podrías cambiar el modelo:
model = whisper.load_model("medium") # Cambia "small" por "medium" o "large"
result = model.transcribe("/content/occitan.mp3")
print(result["text"])
Recuerda que los modelos más grandes pueden requerir más recursos de cómputo, así que ten esto en cuenta si decides probarlos.
Espero que sigas disfrutando de tus experimentos con la transcripción de audio. ¡Es una herramienta realmente poderosa!
Espero haber ayudado y buenos estudios!