Published

2013-01-01

Correspondence Analysis of Contingency Tables with Subpartitions on Rows and Columns

Análisis de correspondencias de tablas de contingencia con subparticiones en filas y columnas

Keywords:

Multidimensional contingency table, Principal component analysis (en)
Análisis en componentes principales, tabla de contingencias multidimensional. (es)

Authors

  • Campo Elías Pardo Universidad Nacional de Colombia
  • Mónica Bécue-Bertaut Universidad Politécnica de Cataluña
  • Jorge Eduardo Ortiz Universidad Santo Tomás
We present Intra-Table Correspondence Analysis using two approaches: Correspondence Analysis with respect to a model and Weighted Principal Component Analysis. In addition, we use the relationship between Correspondence Analysis and the Log-Linear Models to provide a deeper insight into the interactions that each Correspondence Analysis describes. We develop in detail the Internal Correspondence Analysis as an Intra-Table Correspondence Analysis in two dimensions and introduce the Intra-blocks Correspondence Analysis. Moreover, we summarize the superimposed representations and give some aids to interpret the graphics associated to the subpartition structures of the table. Finally, the methods presented in this work are illustrated by their application to the standardized public test data collected from Colombian secondary education students in 2008.
Para presentar los análisis de correspondencias intra-tablas, se usan los enfoques del análisis de correspondencias con respecto a un modelo y del análisis en componentes principales ponderado. Adicionalmente, se utiliza la relación de los análisis de correspondencias con los modelos log-lineales para entender mejor las interacciones que cada análisis de correspondencias describe. Se desarrolla de manera detallada el análisis de correspondencias interno como un análisis de correspondencias intra-tablas en dos dimensiones y se introduce el análisis de correspondencias intrabloques. Por otra parte, se resumen las representaciones superpuestas y las ayudas para la interpretación de las gráficas asociadas a la estructura de subparticiones de la tabla. Finalmente, se ilustran los procedimientos con el análisis de una tabla de contingencia construida a partir de los resultados de las pruebas de estado realizadas a los estudiantes de educación media en Colombia en el año 2008.

Correspondence Analysis of Contingency Tables with Subpartitions on Rowsand Columns

Análisis de correspondencias de tablas de contingencia consubparticiones en filas y columnas

CAMPO ELÍAS PARDO1, MÓNICA BÉCUE-BERTAUT2, JORGE EDUARDO ORTIZ3

1Universidad Nacional de Colombia, Facultad de Ciencias, Departamento de Estadística, Bogotá, Colombia. Associate professor. Email: cepardot@unal.edu.co
2Universidad Politécnica de Cataluña, Departamento de Estadística e Investigación Operativa, Barcelona, España. Professor. Email: monica.becue@upc.es
3Universidad Santo Tomás, Facultad de Estadística, Bogotá, Colombia. Professor. Email: jorgeortiz@usantotomas.edu.co


Abstract

We present Intra-Table Correspondence Analysis using two approaches: Correspondence Analysis with respect to a model and Weighted Principal Component Analysis. In addition, we use the relationship between Correspondence Analysis and the Log-Linear Models to provide a deeper insight into the interactions that each Correspondence Analysis describes. We develop in detail the Internal Correspondence Analysis as an Intra-Table Correspondence Analysis in two dimensions and introduce the Intra-blocks Correspondence Analysis. Moreover, we summarize the superimposed representations and give some aids to interpret the graphics associated to the subpartition structures of the table. Finally, the methods presented in this work are illustrated by their application to the standardized public test data collected from Colombian secondary education students in 2008.

Key words: Multidimensional contingency table, Principal component\\ analysis.


Resumen

Para presentar los análisis de correspondencias intra-tablas, se usan los enfoques del análisis de correspondencias con respecto a un modelo y del análisis en componentes principales ponderado. Adicionalmente, se utiliza la relación de los análisis de correspondencias con los modelos log-lineales para entender mejor las interacciones que cada análisis de correspondencias describe. Se desarrolla de manera detallada el análisis de correspondencias interno como un análisis de correspondencias intra-tablas en dos dimensiones y se introduce el análisis de correspondencias intrabloques. Por otra parte, se resumen las representaciones superpuestas y las ayudas para la interpretación de las gráficas asociadas a la estructura de subparticiones de la tabla. Finalmente, se ilustran los procedimientos con el análisis de una tabla de contingencia construida a partir de los resultados de las pruebas de estado realizadas a los estudiantes de educación media en Colombia en el año 2008.

Palabras clave: análisis en componentes principales, tabla de contingencias multidimensional.


Texto completo disponible en PDF


References

1. Bécue-Bertaut, M. & Pagès, J. (2004), 'A principal axes method for comparing multiple contingency tables: MFACT.', Computational Statistics & Data Analysis 45(3), 481-503.

2. Bécue-Bertaut, M., Pagès, J. & P., C. (2005), Contingency table with a double partition on rows and columns. Visualization and comparison of the partial and global structures, 'Proceedings ASMDA 2005', ENST Bretagne, Applied Stochastic Models and Data Analysis. Brest, France. May,17-20, 2005 p. 355-364. *http://conferences.telecom-bretagne.eu/asmda2005/IMG/pdf/proceedings/355.pdf

3. Cailliez, F. & Pagès, J. (1976), Introduction à l'Analyse des Données, Smash, Paris.

4. Cazes, P., Chessel, D. & Doledec, S. (1988), 'L'analyse des correspondances internes d'un tableau partitionné. Son usage en hydrobiologie', Revue de Statistique Appliquée 36(1), 39-54.

5. Dolédec, S. & Chessel, D. (1991), 'Recent developments in linear ordination methods for environmental sciences', Advances in Ecology 1, 133-155.

6. Escofier, B. (1983), Generalisation de l'analyse des correspondances a la comparaison de tableaux de frequence, Rapports de Recherche 207, Institut National de Recherche en Informatique et en Automatique, Centre de Rennes. IRISA. *http://hal.inria.fr/inria-00076351

7. Escofier, B. (1984), 'Analyse factorielle en référence á un modéle. Application á l'analyse de tableaux d'échanges', Revue de Statistique Appliquée 32(4), 25-36.

8. Escofier, B. (2003), Analyse des Correspondances. Recherches au Coeur de l'Analyse des Données, Presses Universitaires de Rennes - Société Francaise de Statistique, Rennes, France.

9. Escofier, B. & Pagés, J. (1992), Análisis Factoriales Simples y Múltiples. Objetivos, Métodos e Interpretación, Universidad del País Vasco, Bilbao.

10. Escofier, B. & Pagès, J. (1982), Comparaison de groupes de variables définies sur le même ensemble d'individus, Rapports de Recherche 149, INRIA-IRISA, Rennes, France. *http://hal.inria.fr/inria-00076411

11. Husson, F., Josse, J., Le, S. & Mazet, J. (2009), FactoMineR: Factor Analysis and Data Mining with R. R package version 1.12. *http://CRAN.R-project.org/packageFactoMineR

12. Laloë, D., Moazami-Gourdarzi, K. & Chessel, D. (2002), Contribution of individual markers to the analysis of the relationships among breeds by correspondence analysis, '7th World Congress on Genetics Applied to Livestock Production', Montpellier, France. *http://pbil.univ-lyon1.fr/R/articles/arti110.pdf

13. Lebart, L., Morineau, A. & Warwick, (1984), Multivariate Descriptive Statistical Analysis, Wiley, New York.

14. Lebart, L., Piron, M. & Morineau, A. (2006), Statistique exploratoire multidimensionnelle. Visualisation et inférence en fouilles de données, 4 edn, Dunod, Paris.

15. Lobry, J. R. & Chessel, D. (2003), 'Internal Correspondence Analysis of Codon and Amino-Acid Usage in Thermophilic Bacteria', Journal of Applied Genetics 44(2), 235-261.

16. Lobry, J. & Necsulea, A. (2006), 'Synonymous codon usage and its potential link with optimal growth temperature in prokaryotes', Gene 385, 128 - 136.

17. Pagès, J. (2004), 'Multiple Factor Analysis: Main Features and Application to Sensory Data', Revista Colombiana de Estadística 27(1), 1-26.

18. Pagès, J. & Bécue-Bertaut, M. (2006), Multiple Factor Analysis for Contingency Tables, 'Multiple Correspondence Analysis and Related Methods', Chapman and Hall/CRC, chapter 13, p. 299-326.

19. Pardo, C. E. (2011), Métodos en ejes principales para tablas de contingencia con estructuras de partición en filas y columnas, Tesis para optar al título de Doctor en Ciencias-Estadística, Universidad Nacional de Colombia. Facultad de Ciencias. Departamento de Estadística, Bogotá.

20. Pardo, C. & DelCampo, P. (2007), 'Combinacion de metodos factoriales y de analisis de conglomerados en r: el paquete factoclass', Revista Colombiana de Estadistica 30(2), 231-245. *http://www.matematicas.unal.edu.co/revcoles

21. R Development Core Team, (2010), R: A Language and Environment for Statistical Computing, R Foundation for Statistical Computing, Vienna, Austria. ISBN 3-900051-07-0. *http://www.R-project.org/

22. Ramírez, J. R. & Martínez, G. (2010), 'Analisis de correspondencia a partir de una muestra peobabilistica', Revista Colombiana de Estadística 33, 273-293.

23. Sabatier, R. (1987), Methodes factorielles en analyse des données: aproximations et prise en compte de variables concomitantes, Doctorat d'Etat, Universite des Sciences et Techniques du Languedoc, Montpeiller.

24. Sabatier, R., Lebreton, J. & Chessel, D. (1989), Principal Component Analysis with Instrumental Variables as a Tool for Modelling Composition Data, 'Multiway Data Analysis', Elsevier, Amsterdam, p. 341-350.

25. Tenenhaus, M. & Young, F. (1985), 'An Analysis and Synthesis of Multiple Correspondence Analysis, Optimal Scaling, Homogeneity Analysis and other Methods for Quantifying Categorical Multivariate Data', Psychometrika 50(1), 91-119.

26. Thioulouse, J., Chessel, D., Dolédec, S. & Olivier, J. (1997), 'ADE-4: a multivariate analysis and graphical display software', Statistical and Computing 7, 75-83. *http://pbil.univ-lyon1.fr/ADE-4/ADE-4F.html

27. Van der Heijden, P. (1987), Correspondence Analysis of Longitudinal Categorical Data, DSWO Press, Leiden.

28. Van der Heijden, P., de Falguerolles, A. & de Leeuw, J. (1989), 'A combined approach to contingency table analysis using correspondence analysis and log-linear analysis', Applied Statistics, 249-292.


[Recibido en junio de 2011. Aceptado en mayo de 2013]

Este artículo se puede citar en LaTeX utilizando la siguiente referencia bibliográfica de BibTeX:

@ARTICLE{RCEv36n1a07,
    AUTHOR  = {Pardo, Campo Elías and Bécue-Bertaut, Mónica and Ortiz, Jorge Eduardo},
    TITLE   = {{Correspondence Analysis of Contingency Tables with Subpartitions on Rowsand Columns}},
    JOURNAL = {Revista Colombiana de Estadística},
    YEAR    = {2013},
    volume  = {36},
    number  = {1},
    pages   = {115-144}
}

References

Bécue-Bertaut, M. & Pagès, J. (2004), ‘A principal axes method for comparing multiple contingency tables: MFACT.’, Computational Statistics & Data Analysis 45(3), 481–503.

Bécue-Bertaut, M., Pagès, J. & P., C. (2005), Contingency table with a doublé partition on rows and columns. Visualization and comparison of the partial and global structures, in J. Janssen & P. Lenca, eds, ‘Proceedings ASMDA 2005’, Applied Stochastic Models and Data Analysis. Brest, France. May,17-20, 2005, ENST Bretagne, pp. 355–364.

*http://conferences.telecom-bretagne.eu/asmda2005/IMG/pdf/proceedings/355.pdf

Cailliez, F. & Pagès, J. (1976), Introduction à l’Analyse des Données, Smash, Paris.

Cazes, P., Chessel, D. & Doledec, S. (1988), ‘L’analyse des correspondances internes d’un tableau partitionné. Son usage en hydrobiologie’, Revue de Statistique Appliquée 36(1), 39–54.

Dolédec, S. & Chessel, D. (1991), ‘Recent developments in linear ordination methods for environmental sciences’, Advances in Ecology 1, 133–155.

Escofier, B. (1983), Generalisation de l’analyse des correspondances a la comparaison de tableaux de frequence, Rapports de Recherche 207, Institut National de Recherche en Informatique et en Automatique, Centre de Rennes. IRISA.

*http://hal.inria.fr/inria-00076351

Escofier, B. (1984), ‘Analyse factorielle en référence à un modèle. Application à l’analyse de tableaux d’échanges’, Revue de Statistique Appliquée 32(4), 25–36.

Escofier, B. (2003), Analyse des Correspondances. Recherches au Coeur de l’Analyse des Données, Presses Universitaires de Rennes - Société Francaise de Statistique, Rennes, France.

Escofier, B. & Pagès, J. (1992), Análisis Factoriales Simples y Múltiples. Objetivos, Métodos e Interpretación, Universidad del País Vasco, Bilbao.

Escofier, B. & Pagès, J. (1982), Comparaison de groupes de variables définies sur le même ensemble d’individus, Rapports de Recherche 149, INRIA-IRISA, Rennes, France.

*http://hal.inria.fr/inria-00076411

Husson, F., Josse, J., Le, S. & Mazet, J. (2009), FactoMineR: Factor Analysis and Data Mining with R. R package version 1.12.

*http://CRAN.R-project.org/package=FactoMineR

Laloë, D., Moazami-Gourdarzi, K. & Chessel, D. (2002), Contribution of individual markers to the analysis of the relationships among breeds by correspondence analysis, in ‘7th World Congress on Genetics Applied to Livestock Production’, Montpellier, France.

*http://pbil.univ-lyon1.fr/R/articles/arti110.pdf

Lebart, L., Morineau, A. & Warwick (1984), Multivariate Descriptive Statistical Analysis, Wiley, New York.

Lebart, L., Piron, M. & Morineau, A. (2006), Statistique exploratoire multidimensionnelle. Visualisation et inférence en fouilles de données, 4 edn, Dunod, Paris.

Lobry, J. & Necsulea, A. (2006), ‘Synonymous codon usage and its potential link with optimal growth temperature in prokaryotes’, Gene 385, 128 – 136.

Lobry, J. R. & Chessel, D. (2003), ‘Internal Correspondence Analysis of Codon and Amino-Acid Usage in Thermophilic Bacteria’, Journal of Applied Genetics 44(2), 235–261.

Pagès, J. (2004), ‘Multiple Factor Analysis: Main Features and Application to Sensory Data’, Revista Colombiana de Estadística 27(1), 1–26.

Pagès, J. & Bécue-Bertaut, M. (2006), Multiple Factor Analysis for Contingency Tables, in M. Greenacre & J. Blasius, eds, ‘Multiple Correspondence Analysis and Related Methods’, Chapman and Hall/CRC, chapter 13, pp. 299–326.

Pardo, C. & DelCampo, P. (2007), ‘Combinacion de metodos factoriales y de analisis de conglomerados en r: el paquete factoclass’, Revista Colombiana de Estadistica 30(2), 231–245.

*www.matematicas.unal.edu.co/revcoles

Pardo, C. E. (2011), Métodos en ejes principales para tablas de contingencia con estructuras de partición en filas y columnas, Tesis para optar al título de Doctor en Ciencias-Estadística, Universidad Nacional de Colombia. Facultad de Ciencias. Departamento de Estadística, Bogotá.

R Development Core Team (2010), R: A Language and Environment for Statistical Computing, R Foundation for Statistical Computing, Vienna, Austria. ISBN 3-900051-07-0.

*http://www.R-project.org/

Ramírez, J. R. & Martínez, G. (2010), ‘Analisis de correspondencia a partir de una muestra peobabilistica’, Revista Colombiana de Estadística 33, 273–293.

Sabatier, R. (1987), Methodes factorielles en analyse des données: aproximations et prise en compte de variables concomitantes, Doctorat d’Etat, Universite des Sciences et Techniques du Languedoc, Montpeiller.

Sabatier, R., Lebreton, J. & Chessel, D. (1989), Principal Component Analysis with Instrumental Variables as a Tool for Modelling Composition Data, in R. Coppi & S. Bolasco, eds, ‘Multiway Data Analysis’, Elsevier, Amsterdam, pp. 341–350.

Tenenhaus, M. & Young, F. (1985), ‘An Analysis and Synthesis of Multiple Correspondence Analysis, Optimal Scaling, Homogeneity Analysis and other Methods for Quantifying Categorical Multivariate Data’, Psychometrika 50(1), 91– 119.

Thioulouse, J., Chessel, D., Dolédec, S. & Olivier, J. (1997), ‘ADE-4: a multivariate analysis and graphical display software’, Statistical and Computing 7, 75–83.

*http://pbil.univ-lyon1.fr/ADE-4/ADE-4F.html

Van der Heijden, P. (1987), Correspondence Analysis of Longitudinal Categorical Data, DSWO Press, Leiden.

Van der Heijden, P., de Falguerolles, A. & de Leeuw, J. (1989), ‘A combined approach to contingency table analysis using correspondence analysis and log-linear analysis’, Applied Statistics pp. 249–292.

How to Cite

APA

Pardo, C. E., Bécue-Bertaut, M. and Ortiz, J. E. (2013). Correspondence Analysis of Contingency Tables with Subpartitions on Rows and Columns. Revista Colombiana de Estadística, 36(1), 115–144. https://revistas.unal.edu.co/index.php/estad/article/view/39612

ACM

[1]
Pardo, C.E., Bécue-Bertaut, M. and Ortiz, J.E. 2013. Correspondence Analysis of Contingency Tables with Subpartitions on Rows and Columns. Revista Colombiana de Estadística. 36, 1 (Jan. 2013), 115–144.

ACS

(1)
Pardo, C. E.; Bécue-Bertaut, M.; Ortiz, J. E. Correspondence Analysis of Contingency Tables with Subpartitions on Rows and Columns. Rev. colomb. estad. 2013, 36, 115-144.

ABNT

PARDO, C. E.; BÉCUE-BERTAUT, M.; ORTIZ, J. E. Correspondence Analysis of Contingency Tables with Subpartitions on Rows and Columns. Revista Colombiana de Estadística, [S. l.], v. 36, n. 1, p. 115–144, 2013. Disponível em: https://revistas.unal.edu.co/index.php/estad/article/view/39612. Acesso em: 29 mar. 2024.

Chicago

Pardo, Campo Elías, Mónica Bécue-Bertaut, and Jorge Eduardo Ortiz. 2013. “Correspondence Analysis of Contingency Tables with Subpartitions on Rows and Columns”. Revista Colombiana De Estadística 36 (1):115-44. https://revistas.unal.edu.co/index.php/estad/article/view/39612.

Harvard

Pardo, C. E., Bécue-Bertaut, M. and Ortiz, J. E. (2013) “Correspondence Analysis of Contingency Tables with Subpartitions on Rows and Columns”, Revista Colombiana de Estadística, 36(1), pp. 115–144. Available at: https://revistas.unal.edu.co/index.php/estad/article/view/39612 (Accessed: 29 March 2024).

IEEE

[1]
C. E. Pardo, M. Bécue-Bertaut, and J. E. Ortiz, “Correspondence Analysis of Contingency Tables with Subpartitions on Rows and Columns”, Rev. colomb. estad., vol. 36, no. 1, pp. 115–144, Jan. 2013.

MLA

Pardo, C. E., M. Bécue-Bertaut, and J. E. Ortiz. “Correspondence Analysis of Contingency Tables with Subpartitions on Rows and Columns”. Revista Colombiana de Estadística, vol. 36, no. 1, Jan. 2013, pp. 115-44, https://revistas.unal.edu.co/index.php/estad/article/view/39612.

Turabian

Pardo, Campo Elías, Mónica Bécue-Bertaut, and Jorge Eduardo Ortiz. “Correspondence Analysis of Contingency Tables with Subpartitions on Rows and Columns”. Revista Colombiana de Estadística 36, no. 1 (January 1, 2013): 115–144. Accessed March 29, 2024. https://revistas.unal.edu.co/index.php/estad/article/view/39612.

Vancouver

1.
Pardo CE, Bécue-Bertaut M, Ortiz JE. Correspondence Analysis of Contingency Tables with Subpartitions on Rows and Columns. Rev. colomb. estad. [Internet]. 2013 Jan. 1 [cited 2024 Mar. 29];36(1):115-44. Available from: https://revistas.unal.edu.co/index.php/estad/article/view/39612

Download Citation

Article abstract page views

928

Downloads

Download data is not yet available.