1
respuesta

[Duda] función cut(). donde puedo tenre un documentacion de los parametros que aceptan las funciones

me explican como esta funcionando la funcion cut() porfavor. bins = [20, 30, 40, 50, 100] nombres = ['20-30', '30-40', '40-50', '50+']

tarjetas['rango_edad'] = pd.cut(tarjetas['edad'], bins, labels=nombres)

`

1 respuesta

Hola, Diego. Respondiendo a tu duda:

La función en pandas, pd.cut(), es usada para dividir una columna numérica en intervalos o "bins" y colocar etiquetas a cada intervalo (range). Por ejemplo, en el ejercicio propuesto por el profesor vemos que es usado la función pd.cut() para crear una nueva columna llamada "rango_edad" en nuestra base de datos "tarjetas".

La función pd.cut() toma los siguientes argumentos:

  1. tarjetas['edad']: Es la columna de "edad" del DataFrame "tarjetas" que se va a dividir en intervalos.
  2. bins: Es una lista que contiene los límites de los intervalos. En el caso del ejercicio, [20, 30, 40, 50, 100] indica que los intervalos serán: (20, 30], (30, 40], (40, 50], y (50, 100].
  3. labels: Es una lista que contiene las etiquetas o nombres que se asignarán a cada intervalo. En nuestro caso, ['20-30', '30-40', '40-50', '50+'] son las etiquetas correspondientes a los intervalos definidos por los límites en bins.

Finalmente, la función pd.cut() asignará a cada valor de la columna "edad" la etiqueta del intervalo al que pertenece. Si un valor de la columna "edad" está dentro del intervalo (20, 30], se le asignará la etiqueta "20-30". Si está dentro del intervalo (30, 40], se le asignará la etiqueta "30-40", y así sucesivamente.

Espero haber ayudado, abrazos!