Ya estoy inscrito ¿Todavía no tienes acceso? Nuestros Planes
Ya estoy inscrito ¿Todavía no tienes acceso? Nuestros Planes
0
respuestas

09 Desafío: vamos a practicar (Pandas)

#1. Importa el archivo alumnos.csv y almacena su contenido en un DataFrame de Pandas.
import pandas as pd
url = 'https://gist.githubusercontent.com/ahcamachod/807a2c1cf6c19108b2b701ea1791ab45/raw/fb84f8b2d8917a89de26679eccdbc8f9c1d2e933/alumnos.csv'
#alumnos = pd.read_csv(url, sep = ","), en este caso no es necesario sep = ",", ya que viene el separador en el archivo ya viene delimitado por "," y lo toma por defecto
alumnos = pd.read_csv(url)
alumnos

Nombre	Edad	Nota	Aprobado

0 Alberto 20 7.5 True
1 Ana 18 NaN False
2 Camila 27 2.5 False
3 David 18 5.0 False
4 Brian 21 10.0 True
5 Bruna 23 NaN False
6 Daniela 21 7.0 True
7 Carlos 19 6.0 False
8 Alicia 35 5.6 False
9 Victor 28 NaN False
10 Danilo 21 NaN False
11 Ignacio 24 4.5 False
12 Stephany 26 10.0 True
13 Miriam 25 9.0 True
14 Pablo 37 NaN False
15 Milena 29 7.0 True
16 Lucas 33 NaN False
17 Nadia 34 8.0 Verdadero

#2 Visualiza las primeras 7 filas del DataFrame y las últimas 5.
alumnos.head(7)
Nombre Edad Nota Aprobado
0 Alberto 20 7.5 True
1 Ana 18 NaN False
2 Camila 27 2.5 False
3 David 18 5.0 False
4 Brian 21 10.0 True
5 Bruna 23 NaN False
6 Daniela 21 7.0 True

alumnos.tail(5)
Nombre Edad Nota Aprobado
13 Miriam 25 9.0 True
14 Pablo 37 NaN False
15 Milena 29 7.0 True
16 Lucas 33 NaN False
17 Nadia 34 8.0 Verdadero

#3.Verifica la cantidad de filas y columnas en este DataFrame.
alumnos.shape

(18, 4) , el resultado se lee como 18 filas y 4 columnas

#4.Explora las columnas del DataFrame y analiza los tipos de datos presentes en cada columna.
alumnos.columns
Index(['Nombre', 'Edad', 'Nota', 'Aprobado'], dtype='object')

alumnos.info()
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 18 entries, 0 to 17
Data columns (total 4 columns):

Column Non-Null Count Dtype


0 Nombre 18 non-null object ---> es de tipo string (cadena)
1 Edad 18 non-null int64 ---> es de tipo entero (64bit)
2 Nota 12 non-null float64 -->es de tipo float
3 Aprobado 18 non-null object ---> es de tipo string (cadena)
dtypes: float64(1), int64(1), object(2)
memory usage: 708.0+ bytes

#Extra: Calcula algunas estadísticas descriptivas básicas de los datos en el DataFrame (media, desviación estándar, etc.). Pista: busca el método "describe".
alumnos.describe()

###El resultado estadisticos descriptivos de las columnas numericas
Edad Nota
count 18.000000 12.000000 --> Registros de datos
mean 25.500000 6.841667 --> Media
std 6.070662 2.264532 --> Desviación Standard
min 18.000000 2.500000 ---> Valor Minimo de los datos
25% 21.000000 5.450000 ---> Distribución
50% 24.500000 7.000000
75% 28.750000 8.250000
max 37.000000 10.000000 ---> Valor Maximo de los datos

#Extra: Calcula algunas estadísticas descriptivas básicas de los datos en el DataFrame (media, desviación estándar, etc.). Pista: busca el método "describe".

alumnos.describe(include='all')

Versión extendida a todas las columnas de datos, donde se puede ver que las columnas de tipo de datos string no es posible realizar descriptivo

Nombre	Edad	Nota	Aprobado

count 18 18.000000 12.000000 18
unique 18 NaN NaN 3
top Alberto NaN NaN False
freq 1 NaN NaN 11
mean NaN 25.500000 6.841667 NaN ---> Media de los
std NaN 6.070662 2.264532 NaN
min NaN 18.000000 2.500000 NaN
25% NaN 21.000000 5.450000 NaN
50% NaN 24.500000 7.000000 NaN
75% NaN 28.750000 8.250000 NaN
max NaN 37.000000 10.000000 NaN