2
respuestas

[Duda] parámetro df en la función ordenador_cluster() no se utiliza

En la definición de la función hay un parámetro df

def ordenador_cluster(cluster_actual, target, df ): agrupado_por_cluster = df_usuario.groupby(cluster_actual)[target].mean().reset_index()

Sin embargo, no se utiliza dentro de la función. Será que en la primera línea, en lugar de df_usuario.groupby debe ir df.groupby ?

E igualmente en la línea del merge ?

2 respuestas

¡Hola Ernesto!

Gracias por compartir tu duda en el curso de Clusterización de datos: segmentación de clientes. Entiendo que estás confundido acerca del parámetro "df" en la función "ordenador_cluster()" y si debería utilizarse en lugar de "df_usuario.groupby" en la primera línea y en la línea del merge.

Después de revisar el código y el contexto proporcionado, puedo confirmarte que el parámetro "df" en la función "ordenador_cluster()" no se utiliza dentro de la función. Parece ser un error y debería reemplazarse por "df_usuario.groupby" en lugar de "df.groupby".

En cuanto a la línea del merge, no se proporciona suficiente información en el contexto para determinar si hay algún problema. Sin embargo, si tienes alguna duda específica sobre esa línea de código, estaré encantado de ayudarte.

Espero que esta respuesta haya aclarado tu duda. Si tienes alguna otra pregunta, no dudes en hacerla. ¡Estoy aquí para ayudarte!

Espero haber ayudado y buenos estudios!

Gracias por su revisión. Lo que entiendo es que se hace un llamado a la función en la siguiente celda de código:

df_usuario = ordenador_cluster('recencia_cluster','recencia',df_usuario)

enviando como parámetro df_usuario, que debe caer en la variable interna df. Sin embargo, dentro de la función no se utiliza la variable interna df, sino la variable global df_usuario. Lo cual no produce error al ejecutarse, pero sí queda evidenciado que no se utiliza la variable/parámetro df.