















Hola, Andrés, espero que estés bien
Parece que ya has convertido correctamente las fechas al tipo datetime en ambos proyectos. Ahora, para visualizar un subconjunto de datos que pueda ser útil, podrías considerar lo siguiente:
Filtrar por Rango de Fechas:
Puedes filtrar las ventas que ocurrieron durante los 5 días del evento. Por ejemplo, si el evento comenzó el 6 de junio de 2022, puedes hacer algo como:
inicio_evento = '2022-06-06'
fin_evento = '2022-06-10'
ventas_evento = datos_columnas_ventas[(datos_columnas_ventas['Data de venda'] >= inicio_evento) & (datos_columnas_ventas['Data de venda'] <= fin_evento)]
Identificar al Cliente con Mayor Compra:
Una vez que tengas el subconjunto de datos del evento, puedes identificar al cliente con la mayor compra:
cliente_top = ventas_evento.groupby('Cliente')['Valor da compra'].sum().idxmax()
valor_maximo = ventas_evento.groupby('Cliente')['Valor da compra'].sum().max()
Analizar Retrasos en Pagos:
Puedes calcular el retraso en los pagos restando las fechas de pago de las fechas combinadas de pago y luego visualizar aquellos con retrasos significativos:
datos_columnas_condominio['Retraso'] = (datos_columnas_condominio['datas_de_pagamento'] - datos_columnas_condominio['datas_combinadas_pagamento']).dt.days
retrasos_significativos = datos_columnas_condominio[datos_columnas_condominio['Retraso'] > 0]
Visualizar Retrasos:
Puedes crear un gráfico para visualizar los retrasos:
import matplotlib.pyplot as plt
plt.figure(figsize=(10, 6))
plt.hist(retrasos_significativos['Retraso'], bins=range(1, retrasos_significativos['Retraso'].max() + 1), alpha=0.7)
plt.title('Distribución de Retrasos en Pagos')
plt.xlabel('Días de Retraso')
plt.ylabel('Frecuencia')
plt.show()
Espero que estas sugerencias te sean útiles y te ayuden a avanzar en el análisis. ¡Bons estudios!