En este ejercicio resolvimos cuatro demandas clave del equipo de Machine Learning usando Pandas: calculamos el promedio de habitaciones por departamento, identificamos colonias únicas, analizamos el promedio de alquiler por colonia y visualizamos las cinco más costosas con un gráfico de barras.
import pandas as pd
# Supongamos que ya tienes cargado tu DataFrame como 'df'
# 1. Calcular el promedio de habitaciones por departamento
promedio_habitaciones = df[df['tipo'] == 'Departamento']['habitaciones'].mean()
# 2. Verificar cuántas colonias únicas existen
colonias_unicas = df['colonia'].nunique()
# 3. Colonias con el promedio de alquiler más alto
promedio_por_colonia = df.groupby('colonia')['valor'].mean().sort_values(ascending=False)
# 4. Gráfico de las 5 colonias con mayor promedio de alquiler
top5_colonias = promedio_por_colonia.head(5)
top5_colonias.plot(kind='barh', figsize=(10,6), color='skyblue', title='Top 5 colonias por promedio de alquiler')