Prueba chi-cuadrado

En este post se explica qué es la prueba chi-cuadrado en estadística y para qué sirve. Asimismo, encontrarás cómo hacer una prueba chi-cuadrado y, además, un ejercicio resuelto paso a paso.

¿Qué es la prueba chi-cuadrado?

La prueba chi-cuadrado es una prueba estadística que se usa para determinar si existe una diferencia estadísticamente significativa entre la frecuencia esperada y la frecuencia observada.

Lógicamente, el estadístico de la prueba chi-cuadrado sigue una distribución chi-cuadrado. De modo que el valor del estadístico de la prueba se deberá comparar con un valor concreto de la distribución chi-cuadrado. Más abajo veremos cómo se hace la prueba chi-cuadrado.

Este tipo de prueba estadística también se conoce como prueba chi-cuadrado de Pearson y en ocasiones se representa con el símbolo de la distribución chi-cuadrado: prueba χ².

Fórmula de la prueba chi-cuadrado

El estadístico de la prueba chi-cuadrado es igual al sumatorio de los cuadrados de la diferencias entre los valores observados y los valores esperados partido por los valores esperados.

Así pues, la fórmula de la prueba chi-cuadrado es la siguiente:

\displaystyle\chi^2=\sum_{i=1}^k\frac{(O_i-E_i)^2}{E_i}

Donde:

  • \chi^2es el estadístico de la prueba chi-cuadrado, el cual sigue una distribución chi-cuadrado con k-1grados de libertad.
  • kes el tamaño de la muestra de datos.
  • O_ies el valor observado para el dato i.
  • E_ies el valor esperado para el dato i.

La hipótesis nula del contraste de hipótesis de una prueba chi-cuadrado es que los valores observados son equivalentes a los valores esperados. Por otro lado, la hipótesis alternativa del contraste es que alguno de los valores observados es diferente a su valor esperado.

\begin{cases}H_0:O_i=E_i \quad \forall i\\[2ex]H_1:\exists \ O_i\neq E_i \end{cases}

Así pues, dado un nivel de significación \alpha, el estadístico de la prueba calculado se debe comparar con el valor crítico de la prueba para determinar si rechazar la hipótesis nula o la hipótesis alternativa:

  • Si el estadístico de la prueba es menor que el valor crítico \chi_{1-\alpha|k-1}^2, se rechaza la hipótesis alternativa (y se acepta la hipótesis nula).
  • Si el estadístico de la prueba es mayor que el valor crítico \chi_{1-\alpha|k-1}^2, se rechaza la hipótesis nula (y se acepta la hipótesis alternativa).

\begin{array}{l}\text{Si } \chi^2<\chi^2_{1-\alpha|k-1}\text{ se rechaza } H_1\\[3ex]\text{Si } \chi^2>\chi^2_{1-\alpha|k-1}\text{ se rechaza } H_0\end{array}

Ejemplo de la prueba chi-cuadrado

Una vez hemos visto la definición de la prueba chi-cuadrado y cuál es su fórmula, a continuación se muestra un ejemplo resuelto paso a paso para que puedas cómo se hace este tipo de prueba estadística.

  • La propietaria de una tienda afirma que el 50% de sus ventas son del producto A, 35% de sus ventas son del producto B y 15% de sus ventas son del producto C. No obstante, las unidades vendidas de cada producto son las que se muestran en la siguiente tabla de contingencia. Analiza si los datos teóricos de la propietaria son estadísticamente diferentes a los datos reales recopilados.
ProductoVentas observadas (Oi)
Producto A453
Producto B268
Producto C79
Total800

En primer lugar, debemos calcular los valores esperados por la propietaria de la tienda. Para ello, multiplicamos el porcentaje de ventas esperado de cada producto por el número de ventas totales producidas:

\begin{array}{c}E_A=800\cdot 0,5=400\\[2ex]E_B=800\cdot 0,35=280\\[2ex]E_A=800\cdot 0,15=120\end{array}

Por lo tanto, la tabla de distribución de frecuencias del problema queda de la siguiente manera:

ProductoVentas observadas (Oi)Ventas esperadas (Ei)
Producto A453400
Producto B268280
Producto C79120
Total800800

Ahora que ya hemos calculado todos los valores, aplicamos la fórmula de la prueba chi-cuadrado para calcular el estadístico de la prueba:

\begin{array}{c}\displaystyle\chi^2=\sum_{i=1}^k\frac{(O_i-E_i)^2}{E_i}\\[6ex]\chi^2=\cfrac{(453-400)^2}{400}+\cfrac{(268-280)^2}{280}+\cfrac{(79-120)^2}{120}\\[6ex]\chi^2=7,02+0,51+14,00\\[6ex]\chi^2=21,53\end{array}

Una vez calculado el valor del estadístico de la prueba, utilizamos la tabla de la distribución chi-cuadrado para hallar el valor crítico de la prueba. La distribución chi-cuadrado tiene k-1=3-1=2grados de libertad, así que si escogemos un nivel de significación \alpha=0,05el valor crítico de la prueba es el siguiente:

\begin{array}{c}\chi^2_{1-\alpha|k-1}=\ \color{orange}\bm{?}\color{black}\\[4ex]\chi^2_{0,95|2}=5,991\end{array}

Entonces, el estadístico de la prueba (21,53) es mayor que el valor crítico de la prueba (5,991), por lo tanto, se rechaza la hipótesis nula y se acepta la hipótesis alternativa. Esto significa que los datos son significativamente diferentes y, por tanto, la propietaria de la tienda esperaba unas ventas distintas a las que realmente se han producido.

21,53>5,991 \ \color{orange}\bm{\longrightarrow}\color{black} \ \text{Se rechaza } H_0

Interpretación de la prueba chi-cuadrado

La interpretación de la prueba chi-cuadrado no se puede hacer solo con el resultado de la prueba obtenido, sino que se debe comparar con el valor crítico de la prueba.

Lógicamente, cuanto más pequeño sea el valor del estadístico de la prueba calculado, significa que más se parecen los datos observados a los datos esperados. De manera que si el resultado de la prueba chi-cuadrado es 0, implica que los valores observados y los valores esperados son exactamente iguales. Por otro lado, cuanto más grande sea el resultado de la prueba, quiere decir que más distintos son los valores observados de los valores esperados.

Sin embargo, para decidir si los dos conjuntos de datos son estadísticamente diferentes o iguales, se debe comparar el valor calculado de la prueba con el valor crítico de la prueba, para así rechazar la hipótesis nula o la hipótesis alternativa del contraste. Si el estadístico de la prueba es menor que el valor crítico de la distribución, se rechaza la hipótesis alternativa, no obstante, si el estadístico de la prueba es mayor que el valor crítico de la distribución, se rechaza la hipótesis nula.

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Scroll al inicio