Hola Aldo, espero que estés bien
¡Qué interesante tu proyecto Citrus! Parece que estás trabajando en un análisis de datos de naranjas y toronjas utilizando NumPy y matplotlib. Para ayudarte con tu duda, te daré una guía sobre cómo podrías abordar esta tarea.
Primero, necesitas crear arrays específicos para almacenar los datos de diámetro y peso de las naranjas y las toronjas. Según las instrucciones, el diámetro está en la columna cero y el peso en la columna uno. Los datos de las naranjas van hasta la fila 4999 y los de las toronjas comienzan en la fila 5000.
Aquí tienes un ejemplo de cómo podrías hacerlo:
import numpy as np
import matplotlib.pyplot as plt
# Supongamos que tus datos están en un array de NumPy llamado 'datos'
# Selecciona los datos de las naranjas
diametros_naranjas = datos[:5000, 0]
pesos_naranjas = datos[:5000, 1]
# Selecciona los datos de las toronjas
diametros_toronjas = datos[5000:, 0]
pesos_toronjas = datos[5000:, 1]
# Ahora, crea el gráfico
plt.figure(figsize=(10, 6))
plt.scatter(diametros_naranjas, pesos_naranjas, color='orange', label='Naranjas')
plt.scatter(diametros_toronjas, pesos_toronjas, color='pink', label='Toronjas')
plt.xlabel('Diámetro')
plt.ylabel('Peso')
plt.title('Peso en función del Diámetro')
plt.legend()
plt.show()
Este código selecciona los datos de diámetro y peso para las naranjas y toronjas y luego utiliza matplotlib para crear un gráfico de dispersión. Asegúrate de ajustar el nombre del array de datos si es diferente en tu caso.
Espero que esto te ayude a avanzar con tu proyecto. ¡Bons estudios!