Solucionado (ver solución)
Solucionado
(ver solución)
1
respuesta

[Duda] Tiempo de Procesamiento Numpy vs Pandas

Hola, dado el procesamiento de datos de arrays que realizamos, ¿Con cuál librería es más rápido el procesamiento? personalmente me gusta trabajar mucho con pandas para el cálculo de nuevos campos a partir de columnas y numpy lo dejo como un procesamiento más a nivel Serie o Columna. Sin embargo, el tema del tiempo de procesamiento se vuelve vital a la hora de construir proyectos con bigData.

1 respuesta
solución!

Hola, Mario! Excelente pregunta!

En general, NumPy tiende a ser más rápido que Pandas para el procesamiento de datos en arrays debido a su enfoque optimizado en operaciones numéricas. Sin embargo, el rendimiento real puede depender de la naturaleza de las operaciones y el tamaño de los datos. Cuando hablamos en proyectos y en entornos de big data, es posible que necesitemos considerar librerías como Apache Spark para un rendimiento y escalabilidad en procesamiento de datos.

Un abrazo!