Published

2007-07-01

COMBINACIÓN DE MÉTODOS FACTORIALES Y DE ANÁLISIS DE CONGLOMERADOS EN R: EL PAQUETE FACTOCLASS

COMBINATION OF FACTORIAL METHODS AND CLUSTER ANALYSIS IN R: THE PACKAGE FACTOCLASS

Keywords:

software estadístico, análisis multivariado, análisis en componentes principales, análisis de correspondencias, K-medias, clasificación jerárquica, LATEX (es)
Statistical software, Multivariate analysis, Principal components analysis, Correspondence analysis, K-means clustering, Hierarchical clustering, LATEX (en)

Authors

  • Campo Elías Pardo Universidad Nacional de Colombia
  • Pedro César Del Campo Universidad Nacional de Colombia
Se presenta el paquete de R FactoClass, donde se implementa la estrategia descrita en Lebart et al. (1995), que combina métodos factoriales con análisis de conglomerados, en la exploración multivariada de tablas de datos. Se utilizan funciones de ade4 (Chessel et al. 2004) para realizar el análisis factorial de los datos y de stats para el análisis de conglomerados. Se crean funciones para tareas específicas y se modifican algunas de las existentes. Se describen los pasos para crear FactoClass en ambiente Windows y se ilustra el uso del paquete con un ejemplo.
The new R package FactoClass to combine factorial methods and cluster analysis is presented. This package is implemented in order to perform a multivariate exploration of a data table according to Lebart et al. (1995). We use some ade4 functions (Chessel et al. 2004) to perform the factorial analysis of the data and some stats functions in R to perform cluster methods. Some new functions are programmed to make specific tasks and another old ones are modified. We describe the implementation of FactoClass in the Windows environment and illustrate its use with an example.

Combinación de métodos factoriales y de análisis de conglomerados en R: el paquete FactoClass

Combination of Factorial Methods and Cluster Analysis in R: The Package FactoClass

CAMPO ELÍAS PARDO1, PEDRO CÉSAR DEL CAMPO2

1Universidad Nacional de Colombia, Facultad de Ciencias, Departamento de Estadística, Bogotá, Colombia. Profesor asociado. Email: cpardot@unal.edu.co
2Universidad Nacional de Colombia, Facultad de Ciencias, Departamento de Estadística, Bogotá, Colombia. Estadístico. Email: pcdelcampon@unal.edu.co


Resumen

Se presenta el paquete de R FactoClass, donde se implementa la estrategia descrita en Lebart et al. (1995), que combina métodos factoriales con análisis de conglomerados, en la exploración multivariada de tablas de datos. Se utilizan funciones de ade4 (Chessel et al. 2004) para realizar el análisis factorial de los datos y de stats para el análisis de conglomerados. Se crean funciones para tareas específicas y se modifican algunas de las existentes. Se describen los pasos para crear FactoClass en ambiente Windows y se ilustra el uso del paquete con un ejemplo.

Palabras clave: software estadístico, análisis multivariado, análisis en componentes principales, análisis de correspondencias, K-medias, clasificación jerárquica, LaTeX.


Abstract

The new R package FactoClass to combine factorial methods and cluster analysis is presented. This package is implemented in order to perform a multivariate exploration of a data table according to Lebart et al. (1995). We use some ade4 functions (Chessel et al. 2004) to perform the factorial analysis of the data and some stats functions in R to perform cluster methods. Some new functions are programmed to make specific tasks and another old ones are modified. We describe the implementation of FactoClass in the Windows environment and illustrate its use with an example.

Key words: Statistical software, Multivariate analysis, Principal components analysis, Correspondence analysis, K-means clustering, Hierarchical clustering, LaTeX.


Texto completo disponible en PDF


Referencias

1. Cazes, P., Chessel, D. & Doledec, S. (1988), 'L'analyse des correspondances internes d'un tableau partitionné. Son usage en hydrobiologie', Revue de Statistique Appliquée 36(1), 39-54.

2. Chessel, D., Dufour, A. B. & Thioulouse, J. (2004), 'The ade4 Package - I: One-table Methods', R News 4(1), 5-10.

3. DAPD, (1997), Población, estratificación y aspectos socioeconómicos de Santa Fe de Bogotá, Departamento Administrativo de Planeación Distrital, Bogotá, Colombia.

4. Dahl, D. B. (2006), xtable: Export Tables to LaTeX or HTML. David B. Dahl with contributions from many others. R package version 1.4-2..

5. Dalgaard, P. (2002), Introductory Statistics with R, Springer, New York, United States.

6. Dalgaard, P. (2005), ISwR: Introductory Statistics with R. R package version 1.0-6.

7. De Castro, R. (2003), El universo LaTeX, segunda edn, Universidad Nacional de Colombia, Bogotá, Colombia language es.

8. Friendly, M. (1994), 'Mosaic Displays for Multi-Way Contingency Tables', Journal of the American Statistical Association 89(425), 190-200.

9. Hartigan, J. A. & Wong, M. A. (1979), 'A K-means Clustering Algorithm', Applied Statistics 28(100--108).

10. Husson, F., Lê, S. & Mazet, J. (2007), FactoMineR: Factor Analysis and Data Mining with R. R package version 1.05. *http://factominer.free.fr

11. Lebart, L. (2007), 'DTM. Data and Text Mining', Software. *http://ses.enst.fr/lebart/

12. Lebart, L., Morineau, A., Lambert, T. & Pleuvret, P. (1999), SPAD. Système Pour l'Analyse des Donèes, Paris, Francia. *http://www.spad.eu

13. Lebart, L., Morineau, A. & Piron, M. (1995), Statisitique exploratoire multidimensionnelle, Dunod, Paris, France.

14. Ligges, U. (2006), 'R Help Desk: Accessing the Sources', R News 6(4), 43-45.

15. Ligges, U. & Murdoch, D. (2005), 'R Help Desk: Make 'R CMD' Work under Windows - an Example', R News 5(2), 27-28.

16. Pardo, C. E. (1992), Análisis de la aplicación del método de Ward de clasificación jerárquica en el caso de variables cualitativas, Tesis de Maestría, Estadística, Universidad Nacional de Colombia, Facultad de Ciencias, Departamento de Matemáticas y Estadística, Bogotá, Colombia.

17. Pinheiro, J., Bates, D., DebRoy, S. & team., D. S. t. R. C. (2007), nlme: Linear and Nonlinear Mixed Effects Models. R package version 3.1-83.

18. R Development Core Team, (2007a), R: A Language and Environment for Statistical Computing, R Foundation for Statistical Computing, Vienna, Austria. ISBN 3-900051-07-0. *http://www.R-project.org

19. R Development Core Team, (2007b), Writing R Extensions, R Foundation for Statistical Computing, Vienna, Austria. ISBN 3-900051-07-0. *http://www.R-project.org


Este artículo se puede citar en LaTeX utilizando la siguiente referencia bibliográfica de BibTeX:

@ARTICLE{PardoDel Campo07,
AUTHOR = {Campo Elías Pardo and Pedro César Del Campo}
TITLE = {{Combinación de métodos factoriales y de análisis de conglomerados en R: el paquete FactoClass}},
JOURNAL = {Revista Colombiana de Estadística},
YEAR = {2007},
volume = {30},
number = {2},
pages = {231-245}
}

How to Cite

APA

Pardo, C. E. and Del Campo, P. C. (2007). COMBINACIÓN DE MÉTODOS FACTORIALES Y DE ANÁLISIS DE CONGLOMERADOS EN R: EL PAQUETE FACTOCLASS. Revista Colombiana de Estadística, 30(2), 231–245. https://revistas.unal.edu.co/index.php/estad/article/view/29478

ACM

[1]
Pardo, C.E. and Del Campo, P.C. 2007. COMBINACIÓN DE MÉTODOS FACTORIALES Y DE ANÁLISIS DE CONGLOMERADOS EN R: EL PAQUETE FACTOCLASS. Revista Colombiana de Estadística. 30, 2 (Jul. 2007), 231–245.

ACS

(1)
Pardo, C. E.; Del Campo, P. C. COMBINACIÓN DE MÉTODOS FACTORIALES Y DE ANÁLISIS DE CONGLOMERADOS EN R: EL PAQUETE FACTOCLASS. Rev. colomb. estad. 2007, 30, 231-245.

ABNT

PARDO, C. E.; DEL CAMPO, P. C. COMBINACIÓN DE MÉTODOS FACTORIALES Y DE ANÁLISIS DE CONGLOMERADOS EN R: EL PAQUETE FACTOCLASS. Revista Colombiana de Estadística, [S. l.], v. 30, n. 2, p. 231–245, 2007. Disponível em: https://revistas.unal.edu.co/index.php/estad/article/view/29478. Acesso em: 19 apr. 2024.

Chicago

Pardo, Campo Elías, and Pedro César Del Campo. 2007. “COMBINACIÓN DE MÉTODOS FACTORIALES Y DE ANÁLISIS DE CONGLOMERADOS EN R: EL PAQUETE FACTOCLASS”. Revista Colombiana De Estadística 30 (2):231-45. https://revistas.unal.edu.co/index.php/estad/article/view/29478.

Harvard

Pardo, C. E. and Del Campo, P. C. (2007) “COMBINACIÓN DE MÉTODOS FACTORIALES Y DE ANÁLISIS DE CONGLOMERADOS EN R: EL PAQUETE FACTOCLASS”, Revista Colombiana de Estadística, 30(2), pp. 231–245. Available at: https://revistas.unal.edu.co/index.php/estad/article/view/29478 (Accessed: 19 April 2024).

IEEE

[1]
C. E. Pardo and P. C. Del Campo, “COMBINACIÓN DE MÉTODOS FACTORIALES Y DE ANÁLISIS DE CONGLOMERADOS EN R: EL PAQUETE FACTOCLASS”, Rev. colomb. estad., vol. 30, no. 2, pp. 231–245, Jul. 2007.

MLA

Pardo, C. E., and P. C. Del Campo. “COMBINACIÓN DE MÉTODOS FACTORIALES Y DE ANÁLISIS DE CONGLOMERADOS EN R: EL PAQUETE FACTOCLASS”. Revista Colombiana de Estadística, vol. 30, no. 2, July 2007, pp. 231-45, https://revistas.unal.edu.co/index.php/estad/article/view/29478.

Turabian

Pardo, Campo Elías, and Pedro César Del Campo. “COMBINACIÓN DE MÉTODOS FACTORIALES Y DE ANÁLISIS DE CONGLOMERADOS EN R: EL PAQUETE FACTOCLASS”. Revista Colombiana de Estadística 30, no. 2 (July 1, 2007): 231–245. Accessed April 19, 2024. https://revistas.unal.edu.co/index.php/estad/article/view/29478.

Vancouver

1.
Pardo CE, Del Campo PC. COMBINACIÓN DE MÉTODOS FACTORIALES Y DE ANÁLISIS DE CONGLOMERADOS EN R: EL PAQUETE FACTOCLASS. Rev. colomb. estad. [Internet]. 2007 Jul. 1 [cited 2024 Apr. 19];30(2):231-45. Available from: https://revistas.unal.edu.co/index.php/estad/article/view/29478

Download Citation

Article abstract page views

1097

Downloads

Download data is not yet available.