Published
Partial Least Squares Regression on Symmetric Positive-Definite Matrices
Regresión de mínimos cuadrados parciales sobre matrices simétricas definidas positiva
Keywords:
Matrix theory, Multicollinearity, Regression, Riemann manifold (en)Multicolinealidad, regresión, teoría de matrices, variedad Riemanniana. (es)
Downloads
Recientemente ha habido un aumento en el interés de analizar diferentes tipos de datos variedad-valuados, dentro de los cuáles aparecen los datos de matrices simétricas definidas positivas. En muchos estudios de análisis de imágenes médicas cerebrales, es de interés principal establecer la asociación entre un conjunto de covariables y los datos variedad-valuados que son considerados como respuesta, con el fin de caracterizar las diferencias y formas
en ciertas estructuras sub-corticales.
Debido a que los datos variedad-valuados no forman un espacio vectorial, no es adecuado aplicar directamente las técnicas estadísticas clásicas, ya que ciertas operaciones sobre espacio vectoriales no están definidas en una variedad riemanniana general. En este artículo se realiza una aplicación de la metodología de regresión de mínimos cuadrados parciales, para el entorno de un número grande de covariables en un espacio euclídeo y una o varias respuestas que viven una variedad curvada llamada espacio simétrico Riemanniano. Para poder llevar a cabo la aplicación de dicha técnica se utilizan el mapa exponencial Riemanniano y el mapa log Riemanniano sobre el conjunto de matrices simétricas positivas definida, mediante los cuales se transforman los datos a un espacio vectorial en donde se pueden aplicar técnicas estadísticas clásicas. La metodología es evaluada por medio de un conjunto de datos simulados en donde se analiza el comportamiento de la técnica con respecto a la regresión por componentes principales.
1Universidad Nacional de Colombia, Facultad de Ciencias, Escuela de Estadística, Medellín, Colombia. Assistant Professor. Email: raperez1@unal.edu.co
2CIMAT-México Unidad Monterrey, Departamento de Probabilidad y Estadística, Monterrey Nuevo León, México. Associate Professor. Email: gmfarias@cimat.mx
Recientemente ha habido un aumento en el interés de analizar diferentes tipos de datos variedad-valuados, dentro de los cuáles aparecen los datos de matrices simétricas definidas positivas. En muchos estudios de análisis de imágenes médicas cerebrales, es de interés principal establecer la asociación entre un conjunto de covariables y los datos variedad-valuados que son considerados como respuesta, con el fin de caracterizar las diferencias y formas en ciertas estructuras sub-corticales.
Debido a que los datos variedad-valuados no forman un espacio vectorial, no es adecuado aplicar directamente las técnicas estadísticas clásicas, ya que ciertas operaciones sobre espacio vectoriales no están definidas en una variedad riemanniana general. En este artículo se realiza una aplicación de la metodología de regresión de mínimos cuadrados parciales, para el entorno de un número grande de covariables en un espacio euclídeo y una o varias respuestas que viven una variedad curvada llamada espacio simétrico Riemanniano. Para poder llevar a cabo la aplicación de dicha técnica se utilizan el mapa exponencial Riemanniano y el mapa log Riemanniano sobre el conjunto de matrices simétricas positivas definida, mediante los cuales se transforman los datos a un espacio vectorial en donde se pueden aplicar técnicas estadísticas clásicas. La metodología es evaluada por medio de un conjunto de datos simulados en donde se analiza el comportamiento de la técnica con respecto a la regresión por componentes principales.
Key words: multicolinealidad, regresión, teoría de matrices, variedad\linebreak Riemanniana.
Recently there has been an increased interest in the analysis of different types of manifold-valued data, which include data from symmetric positive-definite matrices. In many studies of medical cerebral image analysis, a major concern is establishing the association among a set of covariates and the manifold-valued data, which are considered as responses for characterizing the shapes of certain subcortical structures and the differences between them.
The manifold-valued data do not form a vector space, and thus, it is not adequate to apply classical statistical techniques directly, as certain operations on vector spaces are not defined in a general Riemannian manifold. In this article, an application of the partial least squares regression methodology is performed for a setting with a large number of covariates in a euclidean space and one or more responses in a curved manifold, called a Riemannian symmetric space. To apply such a technique, the Riemannian exponential map and the Riemannian logarithmic map are used on a set of symmetric positive-definite matrices, by which the data are transformed into a vector space, where classic statistical techniques can be applied. The methodology is evaluated using a set of simulated data, and the behavior of the technique is analyzed with respect to the principal component regression.
Palabras clave: Matrix theory, Multicollinearity, Regression, Riemann\linebreak manifold.
Texto completo disponible en PDF
References
1. Arsigny, V., Fillard, P., Pennec, X. & Ayache, N. (2006), 'Log-euclidean metrics for fast and simple calculus on diffusion tensors', Magnetic Resonance in Medicine, 56, 411-421.
2. Barmpoutis, A., Vemuri, B. C., Shepherd, T. M. & Forder, J. R. (2007), 'Tensor splines for interpolation and approximation of DT-MRI with applications to segmentation of isolated rat hippocampi', IEEE Transations on Medical Imaging, 26, 1537-1546.
3. Batchelor, P., Moakher, M., Atkinson, D., Calamante, F. & Connelly, A. (2005), 'A rigorous framework for diffusion tensor calculus', Magnetic Resonance in Medicine, 53, 221-225.
4. Fingelkurts, A. A. & Kahkonen, S. (2005), 'Functional connectivity in the brain - is it an elusive concepts?', Neuroscience and Biobehavioral Reviews, 28, 827-836.
5. Fletcher, P. T. & Joshi, S. (2007), 'Riemannian geometry for the statistical analysis of diffusion tensor data', Signal Processing, 87, 250-262.
6. Grenander, U. & Miller, M. I. (1998), 'Computational anatomy: An emerging discipline', Quarterly of Applied Mathematics, 56, 617-694.
7. Lepore, N., Brun, C. A., Chou, Y., Chiang, M., Dutton, R. A., Hayashi, K. M., Luders, E., Lopez, O. L., Aizenstein, H. J., Toga, A. W., Becker, J. T. & Thompson, P. M. (2008), 'Generalized tensor-based morphometry of HIV/AIDS using multivariate statistics on deformation tensors', IEEE Transactions in Medical Imaging 27, 129-141.
8. Li, Y., Zhu, H., Chen, Y., Ibrahim, J. G., An, H., Lin, W., Hall, C. & Shen, D. (2009), RADTI: regression analysis of diffusion tensor images, 'Progress in Biomedical Optics and Imaging - Proceedings of SPIE', Vol. 7258.
9. Massy, W. F. (1965), 'Principal components regression in exploratory statistical research', Journal of the American Statistical Association 64, 234-246.
10. Pennec, X., Fillard, P. & Ayache, N. (2006), 'A Riemannian framework for tensor computing', International Journal of Computer Vision 66, 41-66.
11. Schwartzman, A. (2006), Random ellipsoids and false discovery rates: Statistics for diffusion tensor imaging data, PhD thesis, Stanford University.
12. Wold, H. (1975), 'Soft modeling by latent variables; the non-linear iterative partial least squares approach', Perspectives in Probability and Statistics,, 1-2.
13. Wold, S., Albano, C., Dunn, W. I., Edlund, U., Esbensen, K., Geladi, P., Hellberg, S., Johansson, E., Lindberg, W. & Sjöström, M. (1984), Multivariate data analysis in chemistry, 'Chemometrics', Vol. 138 of NATO ASI Series, Springer Netherlands, p. 17-95.
14. Yuan, Y., Zhu, H., Lin, W. & Marron, J. S. (2012), 'Local polynomial regression for symmetric positive-definite matrices', Journal of the Royal Statistical Society: Series B (Statistical Methodology) 74(4), 697-719.
15. Zhu, H. T., Chen, Y. S., Ibrahim, J. G., Li, Y. M. & Lin, W. L. (2009), 'Intrinsic regression models for positive-definite matrices with applications to diffusion tensor imaging', Journal of the American Statistical Association 104, 1203-1212.
Este artículo se puede citar en LaTeX utilizando la siguiente referencia bibliográfica de BibTeX:
@ARTICLE{RCEv36n1a10,
AUTHOR = {Pérez, Raúl Alberto and González-Farias, Graciela},
TITLE = {{Partial Least Squares Regression on Symmetric Positive-Definite Matrices}},
JOURNAL = {Revista Colombiana de Estadística},
YEAR = {2013},
volume = {36},
number = {1},
pages = {177-192}
}
References
Arsigny, V., Fillard, P., Pennec, X. & Ayache, N. (2006), ‘Log-euclidean metrics for fast and simple calculus on diffusion tensors’, Magnetic Resonance in Medicine, 56, 411–421.
Barmpoutis, A., Vemuri, B. C., Shepherd, T. M. & Forder, J. R. (2007), ‘Tensor splines for interpolation and approximation of DT-MRI with applications to segmentation of isolated rat hippocampi’, IEEE Transations on Medical Imaging, 26, 1537–1546.
Batchelor, P., Moakher, M., Atkinson, D., Calamante, F. & Connelly, A. (2005), ‘A rigorous framework for diffusion tensor calculus’, Magnetic Resonance in Medicine, 53, 221–225.
Fingelkurts, A. A. & Kahkonen, S. (2005), ‘Functional connectivity in the brain - is it an elusive concepts?’, Neuroscience and Biobehavioral Reviews, 28, 827–836.
Fletcher, P. T. & Joshi, S. (2007), ‘Riemannian geometry for the statistical analysis of diffusion tensor data’, Signal Processing, 87, 250–262.
Grenander, U. & Miller, M. I. (1998), ‘Computational anatomy: An emerging discipline’, Quarterly of Applied Mathematics, 56, 617–694.
Kim, P. T. & Richards, D. S. (2010), ‘Deconvolution density estimation on spaces of positive definite symmetric matrices’, IMS Lecture Notes Monograph Series. A Festschrift of Tom Hettmansperger.
Lepore, N., Brun, C. A., Chou, Y., Chiang, M., Dutton, R. A., Hayashi, K. M., Luders, E., Lopez, O. L., Aizenstein, H. J., Toga, A. W., Becker, J. T. & Thompson, P. M. (2008), ‘Generalized tensor-based morphometry of HIV/AIDS using multivariate statistics on deformation tensors’, IEEE Transactions in Medical Imaging, 27, 129–141.
Li, Y., Zhu, H., Chen, Y., Ibrahim, J. G., An, H., Lin, W., Hall, C. & Shen, D. (2009), RADTI: Regression analysis of diffusion tensor images, in E. Samei & J. Hsieh, eds, ‘Progress in Biomedical Optics and Imaging - Proceedings of SPIE’, Vol. 7258.
Massy, W. F. (1965), ‘Principal components regression in exploratory statistical research’, Journal of the American Statistical Association, 64, 234–246.
Pennec, X., Fillard, P. & Ayache, N. (2006), ‘A Riemannian framework for tensor computing’, International Journal of Computer Vision, 66, 41–66.
Schwartzman, A. (2006), Random ellipsoids and false discovery rates: Statistics for diffusion tensor imaging data, PhD thesis, Stanford University.
Wold, H. (1975), ‘Soft modeling by latent variables; the non-linear iterative partial least squares approach’, Perspectives in Probability and Statistics, pp. 1–2.
Wold, S., Albano, C., Dunn, W.J., I., Edlund, U., Esbensen, K., Geladi, P., Hellberg, S., Johansson, E., Lindberg, W. & Sjöström, M. (1984), Multivariate data analysis in chemistry, in B. Kowalski, ed., ‘Chemometrics’, Vol. 138 of NATO ASI Series, Springer Netherlands, pp. 17–95.
Yuan, Y., Zhu, H., Lin, W. & Marron, J. S. (2012), ‘Local polynomial regression for symmetric positive-definite matrices’, Journal of the Royal Statistical Society: Series B (Statistical Methodology) 74(4), 697–719.
Zhu, H. T., Chen, Y. S., Ibrahim, J. G., Li, Y. M. & Lin, W. L. (2009), ‘Intrinsic regression models for positive-definite matrices with applications to diffusion tensor imaging’, Journal of the American Statistical Association 104, 1203–1212.
How to Cite
APA
ACM
ACS
ABNT
Chicago
Harvard
IEEE
MLA
Turabian
Vancouver
Download Citation
Article abstract page views
Downloads
License
Copyright (c) 2013 Revista Colombiana de Estadística

This work is licensed under a Creative Commons Attribution 4.0 International License.
- Authors retain copyright and grant the journal right of first publication with the work simultaneously licensed under a Creative Commons Attribution License that allows others to share the work with an acknowledgement of the work's authorship and initial publication in this journal.
- Authors are able to enter into separate, additional contractual arrangements for the non-exclusive distribution of the journal's published version of the work (e.g., post it to an institutional repository or publish it in a book), with an acknowledgement of its initial publication in this journal.
- Authors are permitted and encouraged to post their work online (e.g., in institutional repositories or on their website) prior to and during the submission process, as it can lead to productive exchanges, as well as earlier and greater citation of published work (See The Effect of Open Access).