Una exploración de robustez de tres pruebas: dos de permutación y la de Mann-Whitney

Two Permutation Tests and the Mann-Whitney Test: A Robustness Study

FABIÁN BAUTISTA1, EMILSE GÓMEZ2

1Universidad Nacional de Colombia, Facultad de Ciencias, Departamento de Estadística, Bogotá, Colombia. Estadístico. Email: frbautistar@unal.edu.co
2Universidad Nacional de Colombia, Facultad de Ciencias, Departamento de Estadística, Bogotá, Colombia. Profesora asistente. Email: egomezt@unal.edu.co


Resumen

Se exploró y comparó la robustez de las pruebas de Mann-Whitney, de permutación basada en diferencia de medias y de permutación basada en diferencia de medianas mediante simulación para varios grados de violación del supuesto de igualdad de varianzas. Las muestras se generaron de la aproximación a las distribuciones beta, logística y exponencial doble por medio de la familia de distribuciones λ generalizada; se consideraron tamaños de muestra {7,14,21} y razones entre varianzas {0.5,1.0,1.5,2.0}. En los casos donde la muestra de menor tamaño proviene de la población con mayor varianza, el nivel de significación simulado toma valores cercanos a tres veces el obtenido cuando se cumple el supuesto. Para la mayoría de los casos estudiados, las pruebas de permutación presentan los mayores niveles de significación simulados.

Palabras clave: simulación, distribución λ generalizada, pruebas no paramétricas, heterocedasticidad.


Abstract

The robustness of the permutation and the Mann-Whitney U tests was explored and compared through simulation for several violation degrees of the variances equality assumption. Samples were obtained from the approximation to beta, logistic and double exponential distributions by means of the Generalized λ Distribution Family; sample sizes {7,14,21} were considered as well as quotients between variances {0.5,1.0,1.5,2.0}. When the sample of smaller size comes of the population with greatest variance, the simulated significance level takes values of almost three times the obtained whenever the assumption is fulfilled. For most of the cases, permutation tests present higher simulated significance levels.

Key words: Simulation, Generalized Lambda Distribution, Nonparametric tests, Heteroscedasticity.


Texto completo disponible en PDF


Referencias

1. Higgins, J. J. (2004), An Introduction to Modern Nonparametric Statistics, Brooks/Cole, Pacific Grove, USA.

2. Karian, Z. & Dudewicz, E. (2000), Fitting Statistical Distributions to Data: The Generalized Lambda Distribution and the Generalized Bootstrap Methods, Boca Raton, USA.

3. Ludbrook, J. & Dudley, H. (1998), 'Why Permutation Tests are Superior to t and F Tests in Biomedical Research', The American Statistician 52(2), 127-132.

4. Neubert, K. & Brunner, E. (2007), 'A Studentized Permutation Test for the Non-parametric Behrens-Fisher Problem', Computational Statistics and Data Analysis 51, 5192-5204.

5. R Development Core Team, (2007), R: A Language and Environment for Statistical Computing, R Foundation for Statistical Computing, Vienna, Austria. ISBN 3-900051-07-0. *http://www.R-project.org

6. Sortres--Ramos, D. & Castillo--Márquez, L. E. (2000), 'Estimación del nivel de significancia real de la prueba de Mann-Whitney ante violaciones a los supuestos estándar usando simulación Montecarlo', Agrociencia 34(1), 69-74.

7. Stonehouse, J. M. & Forrester, G. J. (1998), 'Robustness of the t and U Tests Under Combined Assumption Violations', Journal of Applied Statistics 1, 63-74.


Este artículo se puede citar en LaTeX utilizando la siguiente referencia bibliográfica de BibTeX:

@ARTICLE{BautistaGómez07,
AUTHOR = {Fabián Bautista and Emilse Gómez}
TITLE = {{Una exploración de robustez de tres pruebas: dos de permutación y la de Mann-Whitney}},
JOURNAL = {Revista Colombiana de Estadística},
YEAR = {2007},
volume = {30},
number = {2},
pages = {177-185}
}