Published
ESTUDIO DE HOMOGENEIDAD DE LA DISPERSIÓN EN DISEÑO A UNA VÍA DE CLASIFICACIÓN PARA DATOS DE PROPORCIONES Y CONTEOS
STUDY OF HOMOGENEITY OF THE DISPERSION IN ONE WAY CLASSIFICATION MODELS WITH PROPORTIONS AND COUNTS DATA
Keywords:
sobredispersión, distribución beta-binomial, distribución binomial negativa, modelo lineal generalizado ponderado, razón de verosimilitud (es)Overdispersion, Proportions, Beta-binomial distribution, Negative binomial distribution, Likelihood ratio, Generalized linear models (en)
Downloads
1Universidad de Córdoba, Departamento de Matemáticas y Estadística, Montería, Colombia. Profesor asistente. Email:mmorales@sinu.unicordoba.edu.co
2Universidad Nacional de Colombia, Facultad de Ciencias, Departamento de Estadística, Bogotá, Colombia. Profesor asociado. Email:lalopezp@unal.edu.co
En el modelamiento de datos donde se evidencia la presencia de sobredispersión, usualmente se asume que para todos los efectos de tratamiento el parámetro de sobredispersión es común. Esta situación no siempre se satisface antes; por el contrario, puede ser más frecuente que la variabilidad exhibida por los datos sea mayor que la variación teórica del modelo; debiendo incorporarse en el modelamiento esta situación. En este artículo se llevan a cabo desarrollos teóricos con los cuales se evidencia si es aceptable o no la hipótesis de homogeneidad del parámetro de dispersión entre tratamientos, cuando estos se ensayan en condiciones de uniformidad del material experimental y la respuesta de interés sea conteos o de proporciones, las cuales se modelan a través de la distribución Binomial Negativa (BN) y Beta Binomial (BB), respectivamente. Se usó la Prueba de Razón de Verosimilitud como criterio para decidir acerca de la hipótesis nula de homogeneidad en el parámetro de dispersión. Para determinar la eficiencia de la prueba propuesta, mediante simulación, con procedimientos algorítmicos desarrollados en R, se evaluó la potencia de las pruebas frente al supuesto de homogeneidad del parámetro de dispersión. Bajo el supuesto que los modelos BB y BN son correctos, se propone el ajuste de un modelo lineal generalizado ponderado como una alternativa para el análisis de datos de conteo y proporción con sobredispersión.
Palabras clave: sobredispersión, distribución beta-binomial, distribuciónbinomial negativa, modelo lineal generalizado ponderado, razón deverosimilitud.
When analyzing data in the presence of over dispersion, the usual practice is to assume a common dispersion parameter to all observations. However, there are situations where the assumption of homogeneity of the dispersion parameter does not hold. In this paper we present theoretical developments that allow contrasting the assumption of homogeneity of the dispersion parameter between treatments, in a completely randomized design, with the responses of proportions and counts, modeled through the distributions beta-binomial and negative binomial respectively. The hypothesis is contrasted through the proof of the likelihood ratio.
Under the assumption that the beta-binomial and the negative binomial models are correct, it is proposed an adjustment of a generalized linear weight ed model as an alternative for the data analysis of counts and proportions when over dispersion is present. It is also evaluated, through simulation, the performance of the proposed proofs in terms of its power.
Key words: Overdispersion, Proportions, Beta-binomial distribution, Negative binomial distribution, Likelihood ratio, Generalized linearmodels.
Texto completo disponible en PDF
Referencias
1. Agresti, A. (2002), Categorical Data Analysis, John Wiley & Sons, New Jersey, United States.
2. Atkinson, A. C. (1981), `Two Graphical Displays for Outlying and Influential Observations in Regression´,Biometrika 68, 13-20.
3. Crowder, M. J. (1978), `Beta-Binomial Anova for Proportions´, Applied Statistics 27(1), 34-37.
4. Crowder, M. J. (1979), `Inference About the Intraclass Correlation Coefficient in the Beta-binomial ANOVA for Proportions´, Journal The Royal Statistical Society 41(2), 230-234.
5. Dobson, A. J. (2002), An Introduction to Generalized Linear Models, Chapmann & Hall/CRC, New York, United States.
6. García, Y. B. & Pérez, J. A. (2008), Efecto de la densidad de siembra en la larvicultura de bagre blanco (sorubim cuspicaudus), Tesis de Pregrado, Departamento de Acuicultura, Facultad de Medicina Veterinaria y Zootecnia, Universidad de Córdoba, Montería, Colombia.
7. Hinde, J. & Demétrio, C. (1998), Overdispersion: Models and Estimation, ABE, S\tilde{a}o Paulo, Brazil.
8. McCullagh, P. & Nelder, J. A. (1989 edition second edition), Generalized Linear Models, Chapmann & Hall/CRC, New York, United States.
9. Morales, M. A. (2008), Estudio de homogeneidad de la dispersión en un diseño completamente al azar con datos de proporciones y conteos, Tesis de Maestría, Departamento de Estadística, Universidad Nacional de Colombia, Bogotá, Colombia.
10. Nelder, J. A. & Wedderburn, D. W. M. (1972), `Generalized Linear Models´, Journal The Royal Statistical Society: Series A 135(3), 370-384.
11. Prentice, R. L. (1986), `Binary Regresion Using an Extended Beta-Binomial Distribution with Discussion of Correlation Induced by Covariate Measurement Errors´, Journal of the American Statistical Association 81(394), 321-327.
12. Ravishanker, N. & Dey, D. K. (2001), A First Course in Linear Model Theory, Chapmann & Hall/CRC, New York, United States.
13. Sudhir, P. & Saha, K. (2007), `The Generalized Linear Model and Extensions: a Review and some Biological and Environmental Applications´, Environmetrics 18, 421-443.
14. Team, R Development Core (2007), R: A Language and Environment for Statistical Computing, R Foundation for Statistical Computing, Vienna, Austria. ISBN 3-900051-07-0. *http://www.R-project.org [ Links ]
Este artículo se puede citar en LaTeX utilizando la siguiente referencia bibliográfica de BibTeX:
@ARTICLE{RCEv32n1a04,AUTHOR = {Morales, Mario Alfonso and López, Luis Alberto},
TITLE = {{Estudio de homogeneidad de la dispersión en diseño a una vía de clasificación para datos de proporciones y conteos}},
JOURNAL = {Revista Colombiana de Estadística},
YEAR = {2009},
volume = {32},
number = {1},
pages = {59-78}
How to Cite
APA
ACM
ACS
ABNT
Chicago
Harvard
IEEE
MLA
Turabian
Vancouver
Download Citation
Article abstract page views
Downloads
License
Copyright (c) 2009 Revista Colombiana de Estadística
This work is licensed under a Creative Commons Attribution 4.0 International License.
- Authors retain copyright and grant the journal right of first publication with the work simultaneously licensed under a Creative Commons Attribution License that allows others to share the work with an acknowledgement of the work's authorship and initial publication in this journal.
- Authors are able to enter into separate, additional contractual arrangements for the non-exclusive distribution of the journal's published version of the work (e.g., post it to an institutional repository or publish it in a book), with an acknowledgement of its initial publication in this journal.
- Authors are permitted and encouraged to post their work online (e.g., in institutional repositories or on their website) prior to and during the submission process, as it can lead to productive exchanges, as well as earlier and greater citation of published work (See The Effect of Open Access).