Ya estoy inscrito ¿Todavía no tienes acceso? Nuestros Planes
Ya estoy inscrito ¿Todavía no tienes acceso? Nuestros Planes
1
respuesta

Actividad Exploración de Datos

Actividad Exploración de Datos.

Continuando con el proyecto de las naranjas/toronjas, ahora debes seleccionar parte de los datos. Las columnas que evaluaremos son el diámetro y el peso. Crea arrays específicos para almacenar el diámetro y el peso de la naranja y la toronja. El diámetro está en la columna cero y el peso en la columna uno. Los datos de las naranjas van hasta la fila 4999 y los datos de las toronjas comienzan en la fila 5000 del archivo.

import numpy as np
url = 'https://gist.githubusercontent.com/ahcamachod/9be09de793dc3bf1e6c3d98eb4e5b1ef/raw/21b85572693200040e11284ef6dcfc3457ec8e11/citrus.csv'
datos_citrus = np.loadtxt(url, delimiter=',', usecols=np.arange(1, 6, 1), skiprows=1)
diametro_naranja = datos_citrus[:5000, 0]
peso_naranja = datos_citrus[:5000, 1]

diametro_toronja = datos_citrus[5000:, 0]
peso_toronja = datos_citrus[5000:, 1]

Después de seleccionar los datos, importa la biblioteca matplotlib y crea un gráfico para el peso en función del diámetro tanto para las naranjas como para las toronjas.

import matplotlib.pyplot as plt

plt.figure(figsize=(10, 6))

# Graficar Naranjas
plt.scatter(diametro_naranja, peso_naranja,
            color='orange', label='Naranja', alpha=0.6, s=10)

# Graficar Toronjas
plt.scatter(diametro_toronja, peso_toronja,
            color='red', label='Toronja', alpha=0.6, s=10)

# Titulo y Etiquetas
plt.title('Peso vs. Diámetro de Cítricos', fontsize=16)
plt.xlabel('Diámetro (cm)', fontsize=12)
plt.ylabel('Peso (gramos)', fontsize=12)

# Leyenda para identificar las frutas
plt.legend()

#Cuadricula
plt.grid(True, linestyle='--', alpha=0.7)

plt.tight_layout()
plt.show()
1 respuesta

Hola Cesar, es un caso interesante el que compartes.
Para separar los datos podrias usar el dataframe aslando los datos sin involucrar tareas manuales como contabilizar en que linea termina cada uno. Por otro lado si necesitas usar un dataframe sin alterar el principal puede agregar siempre el metodo ".copy()".