Ha llegado el momento de que sigas todos los pasos que realicé durante esta clase:
- Descargar el proyecto inicial del entrenamiento
- Importar pandas
- Leer y visualizar los datos
- Verificar el tamaño del dataset
- Crear una tabla con estadísticas descriptivas de los datos del dataset
- Crear una matriz de correlación de los datos de la tabla de estadísticas descriptivas
import pandas as pd
datos = pd.read_csv('/content/dataset.csv', sep=';')
print("Primeras 5 filas del dataset")
print(datos.head())
# Verificar el tamaño del dataset
print(f"\nEl dataset tiene {datos.shape[0]} registros y {datos.shape[1]} columnas.")
# tabla con estadísticas descriptivas
estadisticas = datos.describe()
print("\nEstadísticas Descriptivas")
print(estadisticas)
# matriz de correlación
matriz_correlacion = datos.corr()
print("\nMatriz de Correlación")
print(matriz_correlacion)