Published

2017-01-16

Double Generalized Beta-Binomial and Negative Binomial Regression Models

Modelos de regresión beta-binomial y binomial negativa doblemente generalizados

DOI:

https://doi.org/10.15446/rce.v40n1.61779

Keywords:

Bayesian Approach, Beta-Binomial Distribution, Distribution, Gamma Distribution, Negative Binomial, Overdispersion, Poisson Distribution (en)
Distribución beta-binomial, Distribución binomial negativa, Distribución de Poisson, Distribución gamma, Enfoque bayesiano, Sobredispersión. (es)

Downloads

Authors

  • Edilberto Cepeda-Cuervo Departamento Estadística, Facultad de Ciencias, Universidad Nacional de Colombia, Bogotá, Colombia
  • María Victoria Cifuentes-Amado Departamento Matemáticas, Facultad de Ciencias, Universidad Nacional de Colombia, Bogotá, Colombia
Overdispersion is a common phenomenon  in count datasets, that can greatly affect inferences about the model. In this paper develop three joint mean and dispersion regression models in order to fit overdispersed data. These models are based on  reparameterizations of the beta-binomial and negative binomial distributions. Finally, we propose a Bayesian approach to estimate the parameters of the overdispersion regression models and use it to fit a school absenteeism dataset.

La sobredispersión es un fenómeno común en conjuntos de datos de conteo, que puede afectar en alto grado las inferencias relacionadas con el modelo. En este artículo desarrollamos tres modelos de regresión conjunta de media y dispersión para ajustar datos sobredispersos. Estos modelos se basan en reparameterizaciones de las distribuciones beta-binomial y binomial negativa. Finalmente, proponemos un enfoque Bayesiano para la estimación de los parámetros de los modelos de regresión sobredispersos y lo utilizamos para ajustar un conjunto de datos de ausentismo escolar

https://doi.org/10.15446/rce.v40n1.61779

Double Generalized Beta-Binomial and Negative Binomial Regression Models

Modelos de regresión beta-binomial y binomial negativa doblemente generalizados

EDILBERTO CEPEDA-CUERVO1, MARÎA VICTORIA CIFUENTES-AMADO2

1Universidad Nacional de Colombia, Facultad de Ciencias, Departamento Estadística, Bogotá, Colombia. PhD. Email: ecepedac@unal.edu.co
2Universidad Nacional de Colombia, Facultad de Ciencias, Departamento Matemáticas, Bogotá, Colombia. PhD (c). Email: mvcifuentesa@unal.edu.co


Abstract

Overdispersion is a common phenomenon in count datasets, that can greatly affect inferences about the model. In this paper develop three joint mean and dispersion regression models in order to fit overdispersed data. These models are based on reparameterizations of the beta-binomial and negative binomial distributions. Finally, we propose a Bayesian approach to estimate the parameters of the overdispersion regression models and use it to fit a school absenteeism dataset.

Key words: Bayesian Approach, Beta-Binomial Distribution, Distribution, Gamma Distribution, Negative Binomial, Overdispersion, Poisson Distribution.


Resumen

La sobredispersión es un fenómeno común en conjuntos de datos de conteo, que puede afectar en alto grado las inferencias relacionadas con el modelo. En este artículo desarrollamos tres modelos de regresión conjunta de media y dispersión para ajustar datos sobredispersos. Estos modelos se basan en reparameterizaciones de las distribuciones beta-binomial y binomial negativa. Finalmente, proponemos un enfoque Bayesiano para la estimación de los parámetros de los modelos de regresión sobredispersos y lo utilizamos para ajustar un conjunto de datos de ausentismo escolar.

Palabras clave: distribución beta-binomial, distribución binomial negativa, distribución de Poisson, distribución gamma, enfoque bayesiano, sobredispersión.


Texto completo disponible en PDF


References

1. , S. F. & Cribari-Neto, F. (2004), 'Beta Regression for Modelling Rates and Proportions', Journal of Applied Statistics(31-7), 799-815.

2. Breslow, N. (1984), 'Extra-Poisson variation in Log-Linear models', Journal of Applied Statistics 31, 38-44.

3. Cepeda-Cuervo, E. (2001), Modelagem da Variabilidade em Modelos Lineares Generalizados, Unpublished Math Ph.D. thesis, Mathematics Institute, Universidade Federal do Río de Janeiro.

4. Cepeda-Cuervo, E. & Achcar, J. (2009), 'Modelos de regresión heterocedásticos usando aproximación bayesiana', Revista Colombiana de Estadística 32(2), 267-287.

5. Cepeda-Cuervo, E. & Gamerman, D. (2005), 'Bayesian methodology for modeling parameters in the two parameter exponential family', Revista Estadística 57(168), 93-105.

6. Cepeda-Cuervo, E., Migon, H., Garrido, L. & Achcar, J. (2014), 'Generalized linear models with random effects in the two-parameter exponential family', Journal of Statistical Computation and Simulation 84(3), 513-525.

7. Collet, D. (1991), Modeling Binary Data, Chapman Hall, London.

8. Cox, D. (1983), 'Some remarks on overdispersion', Biometrika 70(1), 269-274.

9. Demétrio, C. & Hinde, J. (1998), 'Overdipersion: Models and estimation', Computational Statistics and Data Analysis 27, 151-170.

10. Demétrio, C., Kokonendji, C. & Zocchi, S. (2007), 'On Hinde-Demétrio regression models for overdispersed count data', Statistical Methodology 4, 277-291.

11. Jórgensen, B. (1997), The Theory of Dispersion Models, Chapman & Hall, London.

12. Lawless, J. (1987), 'Negative binomial regression model', Canadian Journal of Statistics 15(3), 209-225.

13. Margolin, B., Kaplan, N. & Zeiger, E. (1981), 'Statistical analysis of the Ames Salmonella microsome test', Proceedings of the National Academy of Sciences 76, 3779-3783.

14. McCullagh, P. & Nelder, J. (1989), Generalized Linear Models, Chapman Hall, London.

15. Quine, S. (1975), Achievement orientation of aboriginal and white Australian adolescents, Ph.D. Thesis, Australian National University, Australia.

16. Quintero-Sarmiento, A., Cepeda-Cuervo, E. & Núñez-Antón, V. (2012), 'Estimating infant mortality in Colombia: some overdispersion modeling approaches', Journal of Applied Statistics 39(5), 1011-1036.

17. Williams, D. (1975), 'The analysis of binary responses from toxicological experiments involving reproduction and teratogenicity', Biometrics 31(4), 949-952.

18. Williams, D. (1982), 'Extra-binomial Variation in Logistic linear Models', Journal of Applied Statistics 31, 144-148.


[Recibido en junio de 2016. Aceptado en noviembre de 2016]

Este artículo se puede citar en LaTeX utilizando la siguiente referencia bibliográfica de BibTeX:

@ARTICLE{RCEv40n1a07,
    AUTHOR  = {Cepeda-Cuervo, Edilberto and Cifuentes-Amado, María Victoria},
    TITLE   = {{Double Generalized Beta-Binomial and Negative Binomial Regression Models}},
    JOURNAL = {Revista Colombiana de Estadística},
    YEAR    = {2017},
    volume  = {40},
    number  = {1},
    pages   = {141-163}
}

References

Breslow, N. (1984), ‘Extra-Poisson variation in Log-Linear models’, Journal of Applied Statistics 31, 38–44.

Cepeda-Cuervo, E. (2001), Modelagem da Variabilidade em Modelos Lineares Generalizados, Unpublished Math Ph.D. thesis, Mathematics Institute, Universidade Federal do Río de Janeiro.

Cepeda-Cuervo, E. & Achcar, J. (2009), ‘Modelos de regresión heterocedásticos usando aproximación bayesiana’, Revista Colombiana de Estadística 32(2), 267–287.

Cepeda-Cuervo, E. & Gamerman, D. (2005), ‘Bayesian methodology for modeling parameters in the two parameter exponential family’, Revista Estadística 57(168-169), 93–105.

Cepeda-Cuervo, E., Migon, H., Garrido, L. & Achcar, J. (2014), ‘Generalized linear models with random effects in the two-parameter exponential family’, Journal of Statistical Computation and Simulation 84(3), 513–525.

Collet, D. (1991), Modeling Binary Data, Chapman Hall, London.

Cox, D. (1983), ‘Some remarks on overdispersion’, Biometrika 70(1), 269–274.

Demétrio, C. & Hinde, J. (1998), ‘Overdipersion: Models and estimation’, Computational Statistics and Data Analysis 27, 151–170.

Demétrio, C., Kokonendji, C. & Zocchi, S. (2007), ‘On Hinde-Demétrio regression models for overdispersed count data’, Statistical Methodology 4, 277–291.

Ferrari, S. & Cribari-Neto, F. (2004), ‘Beta Regression for Modelling Rates and Proportions’, Journal of Applied Statistics (31-7), 799–815.

Jørgensen, B. (1997), The Theory of Dispersion Models, Chapman & Hall, London.

Lawless, J. (1987), ‘Negative binomial regression model’, Canadian Journal of Statistics 15(3), 209–225.

Margolin, B., Kaplan, N. & Zeiger, E. (1981), ‘Statistical analysis of the Ames Salmonella/ microsome test’, Proceedings of the National Academy of Sciences 76, 3779–3783.

McCullagh, P. & Nelder, J. (1989), Generalized Linear Models, Chapman Hall, London.

Quine, S. (1975), Achievement orientation of aboriginal and white Australian adolescents, Ph.d. thesis, Australian National University, Australia.

Quintero-Sarmiento, A., Cepeda-Cuervo, E. & Núñez-Antón, V. (2012), ‘Estimating infant mortality in Colombia: some overdispersion modeling approaches’, Journal of Applied Statistics 39(5), 1011–1036.

Williams, D. (1975), ‘The analysis of binary responses from toxicological experiments involving reproduction and teratogenicity’, Biometrics 31(4), 949–952.

Williams, D. (1982), ‘Extra-binomial Variation in Logistic linear Models’, Journal of Applied Statistics 31, 144–148.

How to Cite

APA

Cepeda-Cuervo, E. and Cifuentes-Amado, M. V. (2017). Double Generalized Beta-Binomial and Negative Binomial Regression Models. Revista Colombiana de Estadística, 40(1), 141–163. https://doi.org/10.15446/rce.v40n1.61779

ACM

[1]
Cepeda-Cuervo, E. and Cifuentes-Amado, M.V. 2017. Double Generalized Beta-Binomial and Negative Binomial Regression Models. Revista Colombiana de Estadística. 40, 1 (Jan. 2017), 141–163. DOI:https://doi.org/10.15446/rce.v40n1.61779.

ACS

(1)
Cepeda-Cuervo, E.; Cifuentes-Amado, M. V. Double Generalized Beta-Binomial and Negative Binomial Regression Models. Rev. colomb. estad. 2017, 40, 141-163.

ABNT

CEPEDA-CUERVO, E.; CIFUENTES-AMADO, M. V. Double Generalized Beta-Binomial and Negative Binomial Regression Models. Revista Colombiana de Estadística, [S. l.], v. 40, n. 1, p. 141–163, 2017. DOI: 10.15446/rce.v40n1.61779. Disponível em: https://revistas.unal.edu.co/index.php/estad/article/view/61779. Acesso em: 24 apr. 2024.

Chicago

Cepeda-Cuervo, Edilberto, and María Victoria Cifuentes-Amado. 2017. “Double Generalized Beta-Binomial and Negative Binomial Regression Models”. Revista Colombiana De Estadística 40 (1):141-63. https://doi.org/10.15446/rce.v40n1.61779.

Harvard

Cepeda-Cuervo, E. and Cifuentes-Amado, M. V. (2017) “Double Generalized Beta-Binomial and Negative Binomial Regression Models”, Revista Colombiana de Estadística, 40(1), pp. 141–163. doi: 10.15446/rce.v40n1.61779.

IEEE

[1]
E. Cepeda-Cuervo and M. V. Cifuentes-Amado, “Double Generalized Beta-Binomial and Negative Binomial Regression Models”, Rev. colomb. estad., vol. 40, no. 1, pp. 141–163, Jan. 2017.

MLA

Cepeda-Cuervo, E., and M. V. Cifuentes-Amado. “Double Generalized Beta-Binomial and Negative Binomial Regression Models”. Revista Colombiana de Estadística, vol. 40, no. 1, Jan. 2017, pp. 141-63, doi:10.15446/rce.v40n1.61779.

Turabian

Cepeda-Cuervo, Edilberto, and María Victoria Cifuentes-Amado. “Double Generalized Beta-Binomial and Negative Binomial Regression Models”. Revista Colombiana de Estadística 40, no. 1 (January 1, 2017): 141–163. Accessed April 24, 2024. https://revistas.unal.edu.co/index.php/estad/article/view/61779.

Vancouver

1.
Cepeda-Cuervo E, Cifuentes-Amado MV. Double Generalized Beta-Binomial and Negative Binomial Regression Models. Rev. colomb. estad. [Internet]. 2017 Jan. 1 [cited 2024 Apr. 24];40(1):141-63. Available from: https://revistas.unal.edu.co/index.php/estad/article/view/61779

Download Citation

CrossRef Cited-by

CrossRef citations2

1. Sebastian George, Ambily Jose. (2020). Generalized Poisson Hidden Markov Model for Overdispersed or Underdispersed Count Data. Revista Colombiana de Estadística, 43(1), p.71. https://doi.org/10.15446/rce.v43n1.77542.

2. Edilberto Cepeda-Cuervo. (2023). μσ2-Beta and μσ2-Beta Binomial Regression Models. Revista Colombiana de Estadística, 46(1), p.63. https://doi.org/10.15446/rce.v46n1.105335.

Dimensions

PlumX

Article abstract page views

1411

Downloads

Download data is not yet available.