Hola queria ser este aporte durante el curso me paso varias veces que los agentes se quedaban atrapados pensando y consumian todos mis tokens del dia, para evitar eso pueden poner limites en su código de esta forma:
Configuramos un límite máximo de 10 pasos/bucle dentro del grafo
config = {"recursion_limit": 10}
Al invocar el agente, le pasamos la configuración
try:
response = email_agent.invoke(
{"email_input": email_input_final},
config=config
)
except Exception as e:
print(f"⚠️ El agente se detuvo para proteger tus tokens: {e}")
Que yo creo es lo mejor para poder seguir haciendo pruebas en cada proyecto
O poner un limite maximo por proyecto pero esto daria igual porque un error ciclico nos puede comer ese limite jaja
from langchain_google_genai import ChatGoogleGenerativeAI
Inicialización limitando el máximo de tokens generados por respuesta
llm = ChatGoogleGenerativeAI(
model="gemini-2.5-flash",
max_tokens=500 # <--- Ajusta este número según el tamaño máximo de respuesta que desees
)