El Bloqueo Inicial (El problema con Gemini)
Intentamos usar la API oficial de Google (text-embedding-004 y embedding-001), pero el backend de Google AI Studio te devolvía sistemáticamente un error 404 NOT_FOUND bajo la versión v1beta. Esto pasa a veces por conflictos regionales o restricciones en el tipo de proyecto de la API Key. Al no poder generar los vectores con Google, el notebook se quedó completamente trabado.El Desvío (La entrada de Hugging Face)
Para esquivar el bloqueo de la API de Google sin frenar tu curso, decidimos generar los embeddings de forma 100% local y gratuita dentro de tu entorno de Colab.
Cambiamos el proveedor a Hugging Face usando el modelo open-source bge-large-en-v1.5.
Esto eliminó la necesidad de llamadas a servidores externos de Google, solucionando los errores de conexión de raíz.
El Conflicto de Dimensiones (El requisito del video)
El profesor en el video configuró su base de datos en Pinecone para recibir vectores de 3072 dimensiones (típico de modelos premium como los de OpenAI). Sin embargo, nuestro nuevo modelo local de Hugging Face venía configurado de fábrica para escupir vectores fijos de 1024 dimensiones. Si intentábamos subir eso, Pinecone iba a rechazar los datos por error de tamaño.El Bypass Matemático (El adaptador personalizado)
Aquí fue donde metimos mano en el backend de Python. Creamos una clase personalizada (un Wrapper o Adaptador) llamada AdaptadorEmbeddings3072.
Este adaptador toma el fragmento de texto.
Llama al modelo de Hugging Face para generar el vector base de 1024 números.
Aplica un "Padding" matemático: Le pega una lista de ceros (0.0) al final del vector hasta estirarlo artificialmente a exactamente 3072 dimensiones.