Ya estoy inscrito ¿Todavía no tienes acceso? Nuestros Planes
Ya estoy inscrito ¿Todavía no tienes acceso? Nuestros Planes
1
respuesta

[Duda] ¿ Por qué usando "cdf" es "1 - stats.binom.cdf(4, n, p)"

En el ejercicio del cálculo de la probabilidad de éxito en el examen de data science, el candidato comienza a tener éxito con 5 aciertos. Y la probabilidad total de éxito es del 21.31% (sumatoria de éxitos con 5, 6, 7, 8, 9 y 10 aciertos usando Probability Mass Function (pmf)). El camino alternativo usando el "Cumulative Distribution Function (cdf) es "1 - stats.binom.cdf(4, n, p)", ¿Podrían ayudarme a entender ese código por favor?

1 respuesta

Hola Jorge,

¡Entiendo tu pregunta! Cuando trabajamos con distribuciones binomiales, a menudo queremos calcular la probabilidad de que un evento ocurra un cierto número de veces. En tu caso, estás interesado en la probabilidad de que el candidato acierte al menos 5 preguntas en el examen.

La función de distribución acumulativa (CDF) nos da la probabilidad de que un evento ocurra hasta un cierto número de veces. En el caso de stats.binom.cdf(4, n, p), esto calcula la probabilidad de acertar como máximo 4 preguntas. Es decir, suma las probabilidades de acertar 0, 1, 2, 3 y 4 preguntas.

Sin embargo, tú estás interesado en la probabilidad de acertar al menos 5 preguntas. Para obtener esto, puedes restar la probabilidad de acertar hasta 4 preguntas de 1 (que representa la probabilidad total de todos los eventos posibles). Por eso se usa 1 - stats.binom.cdf(4, n, p). Esto te da la probabilidad de acertar 5 o más preguntas, que es exactamente lo que buscas.

Espero que este ejemplo te haya aclarado por qué se utiliza esa fórmula. ¡Espero haber ayudado y buenos estudios!

Si este post te ayudó, por favor, marca como solucionado ✓. Continúa con tus estudios!