Qué es y para qué sirve la prueba de Wilcoxon

¿Alguna vez te has preguntado cómo se pueden comparar dos muestras relacionadas o independientes que no cumplen las condiciones necesarias para otros test paramétricos? En el mundo de la estadística, existe una prueba que puede ayudarnos en esa tarea, la prueba de Wilcoxon, también conocida como Wilcoxon signed-rank test. En este artículo, te explicaremos qué es y para qué sirve esta prueba.

¿Cómo se interpreta la prueba de Wilcoxon?

A modo general, el Wilcoxon signed-rank test compara si las diferencias entre pares de datos siguen una distribución simétrica entorno a un valor. Si dos muestras proceden de la misma población, es de esperar que las diferencias entre cada par de observaciones se distribuyan de forma simétrica entorno al cero.

En la práctica, esta prueba se aplica para comprobar si las medias de dos muestras relacionadas o la mediana de dos muestras independientes son iguales o no. Cabe destacar que las muestras no tienen que tener una distribución normal. Además, los datos tienen que ser dependientes y ordinales, y la distribución de las diferencias tiene que ser simétrica.

Una vez aplicada la prueba de Wilcoxon, se obtiene un valor de p-valor. Si este valor es menor a 0,05 (nivel de significación del 5%), se rechaza la hipótesis nula y se acepta la hipótesis alternativa. Por el contrario, si el valor de p-valor es mayor a 0,05, se acepta la hipótesis nula y se rechaza la hipótesis alternativa.

¿Qué es la prueba de Wilcoxon según autores?

La prueba de Wilcoxon es una prueba estadística no paramétrica que se utiliza para verificar la hipótesis nula de igualdad entre dos medianas poblacionales. Esta técnica es útil cuando los datos son continuos y emparejados, es decir, cuando se tienen observaciones de pre y post prueba tomadas de la misma muestra.

La prueba fue desarrollada por el estadístico estadounidense Frank Wilcoxon en 1945. Junto con las pruebas Rank Sum y Signed Rank, sentaron las bases para una prueba de hipótesis de estadística asimétrica, utilizada para datos de población que pueden clasificarse pero no valores numéricos.

¿Cuándo se utiliza la prueba de Wilcoxon?

Como mencionamos anteriormente, la prueba de Wilcoxon se utiliza para comparar si las medias de dos muestras relacionadas o la mediana de dos muestras independientes son iguales o no. Esta prueba se aplica cuando los datos no tienen una distribución normal y/o cuando las muestras son pequeñas.

Entre los tipos de preguntas que la prueba de Wilcoxon puede ayudarnos a responder, tenemos:

¿Los puntajes de las pruebas difieren de grado a grado para los mismos estudiantes?
¿Tiene un medicamento en particular un efecto sobre la salud cuando se prueba en las mismas personas?

¿Cómo se realiza la prueba de Wilcoxon?

El cálculo de la prueba de Wilcoxon implica tres pasos principales:

Calcular las diferencias entre cada par de observaciones emparejadas.
Asignar a cada una de las diferencias de la primera muestra un rango, sin incluir cero.
Asignar a cada diferencia de la segunda muestra el rango correspondiente al valor absoluto de su magnitud, sin incluir cero.
Calcular la suma de los rangos de la primera muestra (T1) y la suma de los rangos de la segunda muestra (T2).
Obtener el valor absoluto del estadístico de prueba (Z) mediante la fórmula: Z = (|T2 – T1| – 0,5) / √n(n+1)/6, donde n es el tamaño de la muestra.
Obtener el valor de p-valor a través de una tabla estadística de la distribución normal estándar o mediante un software de análisis estadístico.

Una vez obtenidos estos valores, se comparan con el nivel de significación establecido para aceptar o rechazar la hipótesis nula.

Prueba de Wilcoxon para muestras relacionadas: el test de Signos

La prueba de Wilcoxon se puede aplicar en dos situaciones diferentes: cuando se tienen muestras relacionadas y cuando se tienen muestras independientes.

En el primer caso, la prueba se conoce como test de Signos o Wilcoxon signed-rank test. Este test se utiliza para comparar si existe una diferencia significativa de la mediana entre dos muestras relacionadas, es decir, dos mediciones realizadas en la misma muestra en diferentes momentos.

El test de Signos es especialmente útil cuando no se cumple el supuesto de normalidad en las diferencias entre parejas de datos al no requerir ninguna suposición acerca de la distribución de la población de diferencias (siempre y cuando la distribución sea simétrica).

¿Cómo se realiza el test de Signos?

El test de Signos se realiza siguiendo estos pasos:

Calcular las diferencias entre cada par de observaciones emparejadas.
Eliminar los valores iguales a cero.
Calcular el número de pares con valores positivos (N1) y el número de pares con valores negativos (N2).
Calcular el estadístico de prueba (W) mediante la fórmula: W = min(N1, N2).
Obtener el valor de p-valor a través de una tabla estadística de la distribución de la prueba de Signos o mediante un software de análisis estadístico.

El valor de p-valor obtenido se compara con el nivel de significación establecido para aceptar o rechazar la hipótesis nula.

Prueba de Wilcoxon para muestras independientes: el test de rangos con signo de Wilcoxon

En el segundo caso, la prueba de Wilcoxon se conoce como el test de rangos con signo de Wilcoxon o prueba de Mann-Whitney. Esta prueba se utiliza para comparar la mediana de dos muestras independientes y determinar si son similares o diferentes.

Al igual que el test de Signos, el test de rangos con signo de Wilcoxon no requiere que los datos sigan una distribución normal.

¿Cómo se realiza la prueba de Mann-Whitney?

Para realizar la prueba de Mann-Whitney se siguen estos pasos:

Calcular los rangos de ambas muestras juntas/asociadas mediante la función rank().
Calcular la suma de los rangos de cada muestra (T1 y T2).
Calcular el número de elementos en cada muestra (n1 y n2).
Calcular la suma de los rangos de ambas muestras (T).
Calcular el estadístico de prueba (U) para la prueba de Mann-Whitney mediante la fórmula:

U = n1n2 + n1(n1 + 1)/2 – T1

U = n2n1 + n2(n2 + 1)/2 – T2

Obtener el valor de p-valor a través de una tabla estadística de la distribución de la prueba de Mann-Whitney o mediante un software de análisis estadístico.

El valor de p-valor obtenido se compara con el nivel de significación establecido para aceptar o rechazar la hipótesis nula.

¿Cuándo se debe aplicar prueba de Wilcoxon?

La prueba de Wilcoxon se utiliza en situaciones donde la distribución de las muestras no es normal y los datos son ordinales.

Entre los casos específicos en los que se suelen aplicar esta prueba se encuentran:

Estudios antes y después en los que se miden las diferencias entre dos momentos en el tiempo
Estudios que comparan dos medicamentos
Estudios que comparan antes y después de la administración de un mismo medicamento

Aplicación de la prueba de Wilcoxon con software estadístico

La prueba de Wilcoxon se puede realizar con software de análisis estadístico como R, SAS, SPSS, Stata, entre otros.

En el caso de R, se puede calcular la prueba de Wilcoxon para muestras relacionadas mediante la función wilcox.test(). Mientras que la prueba de Wilcoxon para muestras independientes se puede calcular con la función wilcox.test(x, y).

También es importante tener en cuenta que la función rank() de R se utiliza para asignar posiciones (rango) a los datos de una variable. Esta función es muy útil para el cálculo de los estadísticos de prueba de la prueba de Wilcoxon.

Conclusión

En resumen, la prueba de Wilcoxon es una herramienta muy útil en la estadística cuando se trata de comparar dos muestras relacionadas o independientes que no cumplen las condiciones necesarias para otros test paramétricos. Esta prueba es especialmente útil cuando se tienen datos ordenados. La prueba se puede aplicar en diferentes situaciones, como estudios que miden las diferencias entre dos momentos del tiempo o estudios que comparan antes y después de la administración de un mismo medicamento. Además, la prueba se puede aplicar con una variedad de software estadísticos como R, SAS, SPSS y Stata.

En general, la prueba de Wilcoxon es una excelente alternativa a los test paramétricos cuando la distribución de los datos no es normal o cuando los datos no son continuos. Así que si estás en una situación en la que no puedes aplicar un test paramétrico, ¡no dudes en aplicar la prueba de Wilcoxon!