Actividad Exploración de Datos.
Continuando con el proyecto de las naranjas/toronjas, ahora debes seleccionar parte de los datos. Las columnas que evaluaremos son el diámetro y el peso. Crea arrays específicos para almacenar el diámetro y el peso de la naranja y la toronja. El diámetro está en la columna cero y el peso en la columna uno. Los datos de las naranjas van hasta la fila 4999 y los datos de las toronjas comienzan en la fila 5000 del archivo.
import numpy as np
url = 'https://gist.githubusercontent.com/ahcamachod/9be09de793dc3bf1e6c3d98eb4e5b1ef/raw/21b85572693200040e11284ef6dcfc3457ec8e11/citrus.csv'
datos_citrus = np.loadtxt(url, delimiter=',', usecols=np.arange(1, 6, 1), skiprows=1)
diametro_naranja = datos_citrus[:5000, 0]
peso_naranja = datos_citrus[:5000, 1]
diametro_toronja = datos_citrus[5000:, 0]
peso_toronja = datos_citrus[5000:, 1]
Después de seleccionar los datos, importa la biblioteca matplotlib y crea un gráfico para el peso en función del diámetro tanto para las naranjas como para las toronjas.
import matplotlib.pyplot as plt
plt.figure(figsize=(10, 6))
# Graficar Naranjas
plt.scatter(diametro_naranja, peso_naranja,
color='orange', label='Naranja', alpha=0.6, s=10)
# Graficar Toronjas
plt.scatter(diametro_toronja, peso_toronja,
color='red', label='Toronja', alpha=0.6, s=10)
# Titulo y Etiquetas
plt.title('Peso vs. Diámetro de Cítricos', fontsize=16)
plt.xlabel('Diámetro (cm)', fontsize=12)
plt.ylabel('Peso (gramos)', fontsize=12)
# Leyenda para identificar las frutas
plt.legend()
#Cuadricula
plt.grid(True, linestyle='--', alpha=0.7)
plt.tight_layout()
plt.show()