Ya estoy inscrito ¿Todavía no tienes acceso? Nuestros Planes
Ya estoy inscrito ¿Todavía no tienes acceso? Nuestros Planes
1
respuesta

09 Desafío: llegó la hora de practicar

Vamos practicar el uso de la visualización de tablas a través de Pandas. Para la práctica, vamos a utilizar otro conjunto de datos que está disponible en el siguiente enlace: tienda_libros.csv.

En él, tenemos un informe de costos de venta de libros y películas de una tienda. Durante los desafíos, la misión será trabajar con los datos para crear tablas que se adapten a las necesidades de diversos análisis que pueden realizarse en la tienda. Para una mejor comprensión de los datos, a continuación se muestra lo que representa cada dato en las columnas.

pais: país de destino del producto.
id_cliente: código de identificación del cliente solicitante.
fecha_pedido: fecha de solicitud del producto por parte del cliente.
fecha_llegada: fecha de llegada del producto a la dirección de entrega proporcionada por el cliente.
tipo_compra: categoría a la que pertenece la compra, que puede ser Normal o Devolución.
numero_pedido: código de identificación de la compra realizada.
tamano_pacote: tamaño del paquete para el envío del pedido.
unidades: cantidad de unidades compradas en el pedido.
costo_empacado: valor del costo de empaquetado del producto para la tienda.
costo_envio: valor del costo de envío del producto para la tienda.
tipo_descuento: categoría del tipo de descuento aplicado.
categoria: categoría del tipo de producto.
tipo_consumo: nivel de consumo del producto por tiempo de uso.
tipo_cliente: categoría del tipo de cliente.
costo_producto: valor total del costo que resulta el pedido para la tienda.

El primer desafío es construir una visualización que permita identificar qué países han solicitado más productos por pedidos, para así poder realizar un estudio sobre la distribución y logística de productos.


import pandas as pd

# Carga de datos
url = "https://gist.githubusercontent.com/ahcamachod/52da15c2bbb31e4270b5c267dd051473/raw/62c366878ebd4be2ec899836413c8d1f3e116c01/tienda_libros.csv"
df = pd.read_csv(url)

# Procesamiento
distribucion_logistica = df.groupby('pais')[['unidades']].sum().sort_values(by='unidades', ascending=False)

# visualización estructurada
estilo_logistica = distribucion_logistica.style\
    .format('{:,}')\
    .bar(subset='unidades', color='#5fba7d', vmin=0)\
    .set_caption('Distribución de Unidades Solicitadas por País')\
    .set_table_styles([
        {'selector': 'th', 'props': [('background-color', '#2c3e50'), ('color', 'white'), ('text-align', 'center')]},
        {'selector': 'caption', 'props': [('font-size', '16px'), ('font-weight', 'bold'), ('padding', '10px')]}
    ])

estilo_logistica

Vamos practicar el uso de la visualización de tablas a través de Pandas. Para la práctica, vamos a utilizar otro conjunto de datos que está disponible en el siguiente enlace: tienda_libros.csv.

En él, tenemos un informe de costos de venta de libros y películas de una tienda. Durante los desafíos, la misión será trabajar con los datos para crear tablas que se adapten a las necesidades de diversos análisis que pueden realizarse en la tienda. Para una mejor comprensión de los datos, a continuación se muestra lo que representa cada dato en las columnas.

pais: país de destino del producto.
id_cliente: código de identificación del cliente solicitante.
fecha_pedido: fecha de solicitud del producto por parte del cliente.
fecha_llegada: fecha de llegada del producto a la dirección de entrega proporcionada por el cliente.
tipo_compra: categoría a la que pertenece la compra, que puede ser Normal o Devolución.
numero_pedido: código de identificación de la compra realizada.
tamano_pacote: tamaño del paquete para el envío del pedido.
unidades: cantidad de unidades compradas en el pedido.
costo_empacado: valor del costo de empaquetado del producto para la tienda.
costo_envio: valor del costo de envío del producto para la tienda.
tipo_descuento: categoría del tipo de descuento aplicado.
categoria: categoría del tipo de producto.
tipo_consumo: nivel de consumo del producto por tiempo de uso.
tipo_cliente: categoría del tipo de cliente.
costo_producto: valor total del costo que resulta el pedido para la tienda.

El primer desafío es construir una visualización que permita identificar qué países han solicitado más productos por pedidos, para así poder realizar un estudio sobre la distribución y logística de productos.

Ingrese aquí la descripción de esta imagen para ayudar con la accesibilidad

1 respuesta

Hola César, espero que estés bien

Tu código para visualizar la distribución de unidades solicitadas por país parece estar bien estructurado. Has utilizado pandas para cargar y procesar los datos, y pandas Styler para dar formato a la tabla. Aquí tienes algunas sugerencias y aclaraciones:

  1. Carga de Datos: Asegúrate de que el enlace al archivo CSV es correcto y accesible. Parece que ya lo tienes bien configurado.

  2. Agrupación y Suma: Estás agrupando por país y sumando las unidades, lo cual es correcto para obtener el total de productos solicitados por cada país.

  3. Ordenación: Ordenar los valores de manera descendente te ayuda a identificar rápidamente los países con más productos solicitados.

  4. Estilización: El uso de Styler para dar formato a la tabla es una excelente manera de mejorar la presentación visual. Has aplicado un formato de número con comas y una barra de color para facilitar la comparación visual.

Si quieres mejorar aún más la visualización, podrías considerar:

  • Añadir más estilos: Puedes experimentar con diferentes colores y estilos para las celdas y encabezados.
  • Incluir gráficos: Además de la tabla, podrías considerar agregar un gráfico de barras utilizando matplotlib o seaborn para una representación visual más clara.

Espero que estas sugerencias te sean útiles y que tu visualización cumpla con tus expectativas. ¡Bons estudios!