# 1. Invocamos la cadena del agente especificando las columnas del análisis anterior
respuesta_3 = cadena_agente.invoke({
"question": """
¿Cuál es la mediana de las columnas años de experiencia del colaborador,
tiempo de entrega y clasificación del colaborador?
"""
})
# 2. Imprimimos la respuesta analítica en una línea nueva
print(respuesta_3['response'])
La mediana de las columnas "años de experiencia del colaborador", "tiempo de entrega" y "clasificación del colaborador" es de 12.0, 125.0 y 4.7 respectivamente. Esto significa que la mitad de los colaboradores tienen más de 12 años de experiencia, la mitad de los proyectos tienen un tiempo de entrega mayor a 125 unidades (que pueden ser días, semanas, etc.) y la mitad de los colaboradores tienen una clasificación mayor a 4.7.
Es importante tener en cuenta que la mediana es una medida de tendencia central que puede ser útil para entender la distribución de los datos, especialmente cuando hay valores atípicos o outliers. En este caso, la mediana nos da una idea de los valores típicos para cada columna.
Si deseas obtener más información o realizar un análisis más detallado, por favor házmelo saber. Estoy aquí para ayudarte.
import inspect
# 1. Limpiamos la consulta y estructuramos las órdenes de forma clara para el agente
pregunta_estructura = inspect.cleandoc("""
Realiza las siguientes acciones sobre el dataframe de forma secuencial:
1. Obtén las dimensiones exactas (filas y columnas).
2. Obtén los nombres de todas las columnas junto con sus tipos de datos.
Responde detalladamente con ambos resultados estrictamente en español.
""")
# 2. Invocamos al agente
respuesta_4 = agente_ejecutor.invoke({"input": pregunta_estructura})
Respuesta:
Entering new AgentExecutor chain...
Invoking: python_repl_ast with {'query': 'print(df.shape)'}
(43739, 16)
Invoking: python_repl_ast with {'query': 'print(df.dtypes)'}
ID_pedido object
años_experiencia_colaborador int64
clasificacion_colaborador float64
latitud_tienda float64
longitud_tienda float64
latitud_entrega float64
longitud_entrega float64
fecha_pedido object
hora_pedido object
hora_retirada object
clima object
trafico object
vehiculo object
area object
categoria_producto object
tiempo_entrega int64
dtype: object
El dataframe df tiene 43739 filas y 16 columnas.
Los nombres de las columnas junto con sus tipos de datos son:
- ID_pedido: object
- años_experiencia_colaborador: int64
- clasificacion_colaborador: float64
- latitud_tienda: float64
- longitud_tienda: float64
- latitud_entrega: float64
- longitud_entrega: float64
- fecha_pedido: object
- hora_pedido: object
- hora_retirada: object
- clima: object
- trafico: object
- vehiculo: object
- area: object
- categoria_producto: object
- tiempo_entrega: int64
Finished chain.