Estos datos se leerán a través de enlaces (URL) que compartimos a continuación:
import pandas as pd
URLs de los datos
url_clientes = "https://gist.githubusercontent.com/ahcamachod/d08898e1cc84c7271856e78d9558ca3d/raw/2f7e1fa53711efe6433a5c5ec79948f600591cb9/clientes_zoop.csv" url_ventas = "https://gist.githubusercontent.com/ahcamachod/966d7162a3c3a2769b8770b35abf1bcc/raw/d79941b3fa46a450f3611589abd8663399c1277b/ventas_zoop.csv" url_zoop_pay = "https://gist.githubusercontent.com/ahcamachod/ce728231a836a973c0df94a9f03ed871/raw/8db6da43d7cd94fcab937208067d0fceb521b78c/zoop_pay.csv"
Cargar las bases de datos
clientes = pd.read_csv(url_clientes) ventas = pd.read_csv(url_ventas) zoop_pay = pd.read_csv(url_zoop_pay)
Unir clientes y ventas usando la columna ID_compra
df = pd.merge(ventas, clientes, on='ID_compra', how='left')
Asegurar que la columna 'fecha' sea tipo datetime
df['fecha'] = pd.to_datetime(df['fecha'], errors='coerce')
Unir con zoop_pay (usando ID_cliente como llave común si aplica)
df = pd.merge(df, zoop_pay, on='ID_cliente', how='left')
Renombrar columnas si es necesario para ajustarse al formato final
df.rename(columns={ 'categoria': 'categoría', 'preco_unitario': 'precio unitario' }, inplace=True)
Reordenar columnas
columnas_finales = [ 'ID_compra', 'fecha', 'horario', 'categoría', 'precio unitario', 'quantidade', 'envio', 'metodo_pago', 'ID_cliente', 'idade', 'sexo_biologico', 'cidade', 'estado', 'regiao', 'cashback', 'nota' ]
df = df[columnas_finales]
Visualizar las primeras filas
print(df.head())