[Sugerencia] Sobre Gemini

Christian Ariel Garay · 2026-06-22 20:15

1. El Bloqueo Inicial (El problema con Gemini) Intentamos usar la API oficial de Google (**text-embedding-004** y **embedding-001**), pero el backend de Google AI Studio te devolvía sistemáticamen

El Bloqueo Inicial (El problema con Gemini)
Intentamos usar la API oficial de Google (text-embedding-004 y embedding-001), pero el backend de Google AI Studio te devolvía sistemáticamente un error 404 NOT_FOUND bajo la versión v1beta. Esto pasa a veces por conflictos regionales o restricciones en el tipo de proyecto de la API Key. Al no poder generar los vectores con Google, el notebook se quedó completamente trabado.
El Desvío (La entrada de Hugging Face)
Para esquivar el bloqueo de la API de Google sin frenar tu curso, decidimos generar los embeddings de forma 100% local y gratuita dentro de tu entorno de Colab.

Cambiamos el proveedor a Hugging Face usando el modelo open-source bge-large-en-v1.5.

Esto eliminó la necesidad de llamadas a servidores externos de Google, solucionando los errores de conexión de raíz.

El Conflicto de Dimensiones (El requisito del video)
El profesor en el video configuró su base de datos en Pinecone para recibir vectores de 3072 dimensiones (típico de modelos premium como los de OpenAI). Sin embargo, nuestro nuevo modelo local de Hugging Face venía configurado de fábrica para escupir vectores fijos de 1024 dimensiones. Si intentábamos subir eso, Pinecone iba a rechazar los datos por error de tamaño.
El Bypass Matemático (El adaptador personalizado)
Aquí fue donde metimos mano en el backend de Python. Creamos una clase personalizada (un Wrapper o Adaptador) llamada AdaptadorEmbeddings3072.

Este adaptador toma el fragmento de texto.

Llama al modelo de Hugging Face para generar el vector base de 1024 números.

Aplica un "Padding" matemático: Le pega una lista de ceros (0.0) al final del vector hasta estirarlo artificialmente a exactamente 3072 dimensiones.

Hola, Christian. ¿Cómo vas?

Gracias por compartir tus reflexiones y aprendizajes con la comunidad Alura. Me gustó cómo organizaste el razonamiento del problema: identificaste el bloqueo con Gemini, buscaste una alternativa con Hugging Face y notaste el conflicto entre las 1024 dimensiones del modelo local y las 3072 dimensiones configuradas en Pinecone. Ese análisis muestra una buena comprensión del pipeline de RAG y de cómo cada parte depende de la otra.

Como consejo, cuando cambies el modelo de embeddings, lo más recomendable es ajustar también el índice de Pinecone para que tenga la misma cantidad de dimensiones del modelo usado. En vez de completar el vector con ceros hasta 3072, puedes crear un índice nuevo con 1024 dimensiones, así los vectores mantienen su representación original y evitas resultados menos precisos en la búsqueda semántica. Sigue explorando estas adaptaciones, porque entender estos detalles ayuda mucho al trabajar con RAG en proyectos reales. Cuenta con el apoyo del foro en tu viaje. Saludos y buenos estudios!

Trilhas por carreira

Carreiras de IA

Carreiras de Dados

Carreiras de Cyber

Carreiras de DevOps & Cloud

Carreiras de UX & UI

Carreiras de Mobile & Front-End

Carreiras de Back-End

Carreiras de Negócios

Cursos universitários FIAP

Tópicos relacionados

Contenidos de Alura sobre el tema