import pandas as pd
datos = pd.read_csv('alquiler_residencial1.csv',sep = ';')
datos.head(10)
datos['Valor'].mean()
#barrios = ['Ate','Barranco','Comas','Lince','El Agustino','San Luis','Callao']
#seleccion = datos['Distrito'].isin(barrios)
#datos = datos[seleccion]
datos.head(10)
datos['Distrito'].drop_duplicates()
grupo_barrio = datos.groupby('Distrito')
type(grupo_barrio)
grupo_barrio.groups
for barrio, data in grupo_barrio:
print('{} -> {}'.format(barrio,data.Valor.mean()))
grupo_barrio['Valor'].mean().round(2)
grupo_barrio[['Valor','Mantenimiento']].mean().round(2)
grupo_barrio['Valor'].describe().round(2)
grupo_barrio['Valor'].aggregate(['min','max']).rename(columns = {'min':'Minimo','max':'Maximo'})
#**Biblioteca matplot**
%matplotlib inline
import matplotlib.pyplot as plt
plt.rc('figure',figsize = (40,20))
fig = grupo_barrio['Valor'].mean().plot.bar(color = 'blue')
fig.set_ylabel('Valor del Alquiler')
fig.set_title('Valor Medio del Alquiler por Distrito',{'fontsize':22})
fig = grupo_barrio['Valor'].max().plot.bar(color = 'red')
fig.set_ylabel('Valor del Alquiler')
fig.set_title('Valor Maximo del Alquiler por Distrito',{'fontsize':22})
#Rango de Valores
datos1 = pd.read_csv('alquiler.csv',sep = ';')
datos1.head(10)
# Se agrupan locales con 1 y 2 cuartos
# Se agrupan locales con 3 y 4 cuartos
# Se agrupan locales con 5 y 6 cuartos
# Se agrupan locales con 7 o mas cuartos
clases = [0,2,4,6,100]
cuartos = pd.cut(datos1.Cuartos,clases)
cuartos
pd.value_counts(cuartos)
label = ['1 y 2 Cuartos','3 y 4 Cuartos','5 y 6 Cuartos','mas de 7 Cuartos']
cuartos = pd.cut(datos1.Cuartos,clases,labels = label)
pd.value_counts(cuartos)
cuartos = pd.cut(datos1.Cuartos,clases,labels = label,include_lowest = True)
pd.value_counts(cuartos)