Regresión por mínimos cuadrados parciales PLS con datos de intervalo
Partial least squares regression PLS on interval data
DOI:
https://doi.org/10.15446/rev.fac.cienc.v5n1.54616Palabras clave:
Regresión por componentes principales, mínimos cuadrados parciales PLS, optimización intervalo-valuada, intervalo valores y vectores propios (es)Principal components regression, partial least squares regression PLS, interval-valued optimization, interval eigen values and eigen vectors (en)
Descargas
La incertidumbre en los datos puede ser considerada mediante un intervalo numérico en el cual una variable puede asumir sus posibles valores, esto se conoce como datos de intervalo. En este artículo se extiende la metodología de regresión PLS al caso donde tanto las variables explicativas como las variables respuesta y los coeficientes de regresión son del tipo intervalo. De ésta manera se propone una metodología de regresión que resuelve tres problemas que se presentan con los datos de tipo real: en primer lugar problemas de multicolinealidad tanto en las variables explicativas como en las variables respuesta, en segundo lugar problemas cuando los datos no pertenecen a un espacio Euclídeo y por último problemas cuando la incertidumbre en los datos se representa por medio de intervalos. Hoy en día existen tareas del común, tales como planificación y operación de sistemas eléctricos, planificación de producción, logística del transporte, inventarios, gestión de carteras de valores, entre otras, que involucran incertidumbre. De ésta manera se requieren modelos que tengan en cuenta dicha incertidumbre y puedan dar la posibilidad de tomar decisiones para resultados óptimos desde una gama de posibilidades o escenarios posibles. Por otro lado, el análisis de datos reales a menudo se ve afectado por diferentes tipos de errores tales como: errores de medición, errores de cálculo e impresición relacionada con el método adoptado para la estimación de los datos. Este trabajo es una propuesta metodológica de tipo teórico y está fundamentada en los desarrollos teóricos sobre optimización matemática sobre los conjuntos de multi-intervalos y multi-matrices.
Referencias
Billard, L.; Diday, E. (2000). Regression Analysis for Interval-Valued Data. Data analysis, Classicaiton, and Related Methods. eds. H.A.L. Kiers, J.-P. Rassoon, P.J.F.Groenen, and M. Schader, Springer-Verlag, Berlin. 369-374.
Billard, L.; Diday, E. (2007). Symbolic Data Analysis: Conceptual Statistics and Data Mining. Wiley, Chichester. 295-306.
De Carvalho, F.A.T Et. al. (2004). A New Method to Fit a Linear Regression Model for Intervalvalued Data, Springer-Verlag, Berlin. 295-306.
Federica, G.; Carlo, N. (2006). Principal components analysis on interval data . Computational Statistic. 21. 343-363.
Fernandez, J.P (2008). Optimizacion multi-objetivo intervalo valuada. Thesis of Master. Universidad EAFIT.
Gallego-Posada, J.D; Puerta-Yepes, M.E. (2015). Interval Analysis and Optimization Applied to Parameter Estimation under Uncertainty. Preprint.
Gioia, F.; Lauro, C. (2005). Basic Statistical Methods for Interval Data. Statistica Applicata. 17. In press.
Grant, M.; Boyd, S. (2000). Graph implementations for nonsmooth convex programs Recent Advances in Learning and Control, Springer-Verlag, Limited.
Hardy, G. (1916). Weierstrass non-dierentiable function. Transactions of the American Mathe-matical Society, 17, 301.
Hladik, M., et al. (2008). An Algorithm for the Real Interval Eigenvalue Problem. Institut National of de Recherche en Informatique et en Automatique, 6680, 1-28.
Hladik, M., et al. (2009). Bounds on eigenvalues and singular values of interval matrices. Institut National of de Recherche en Informatique et en Automatique, 1234, 1-18.
Hladik, M., et al. (2011). Characterizing and approximating eigenvalue sets of symmetric interval matrices. Computers and Mathematics with Applications, 62, 3152-3163.
I.CVX Research (2012). CVX: Matlab software for disciplined convex programming, version 2.0.http://cvxr.com/cvx.
Moore, R., et al. (2009). Introduction to Interval Analysis. Society for Industrial and Applied Mathematics, Philadelphia.
Neto, E.A, Et. al. (2004). Univariate and Multi-variate Linear Regression Methods to Predict Interval-valued Features, Springer-Verlag, Berlin. 526-537.
Neto, E.A, Et. al. (2010). Constrained Linear Regression Models for Symbolic Interval-valued Variables, Computational Statistics and Data Analysis. 54(2). 333-347.
Neto, E.A, Et. al. (2005). Applying Constrained Linear Aggression Models to Predict Interval-Valued Data, Springer-Verlag,Berlin. 92-106.
Radstrom, H. (1953). An embedding theorem for spaces of convex sets. American MAthematical Society, 3, 165-169.
Rhon, J. (1993). Interval Matrices: Singularity and Real Eigenvalues. Society for Industrial and Applied Mathematics, 14, 82-91.
Rhon, J. (2011). Inverse Interval Matrix: A Survey. Electronic Journal in Linear Algebra, 22, 704-719.
Storn, R. & Price, K. (1997). Dierential evolution-a simple and ecient heuristic for global optimization over continuous spaces. Jornal of Global Optimization, 11, 341-359.
Stoyanov (2014). Eigenvalues of Symmetric Interval Matrices. Thesis of Master. Charles University in Praga.
Wold, H. (1975). Soft Modeling byLatent Variables; The Non-linear Iterative Partial Least Squares Approach. Perspectives in Probability and Statistics, , 1-2.
Wold, H. (1985). Partial Least Sqaures. Encyclopedia of Statistical Sciences, 6, 581-591.
Wold, H. (2001). Personal Memories of the early PLS Development. Chemometrics and Intelligent Laboratory Sistems, 58, 109-130.
Wold, H. (1982). Estimation of Principal Components and Related Models by Iterative Least Squares. In Krishnaiah, P(ed.), Multivariate Analysis, Academic Press. New York. 391-420.
Wold, S. et al. (1984). Multivariate Data Analysis in Chemestry, in Chemometrics, Mathematics and Statistics in Chemestry. Reidel Publishing Company. Dordrecht. 17-18.
Cómo citar
APA
ACM
ACS
ABNT
Chicago
Harvard
IEEE
MLA
Turabian
Vancouver
Descargar cita
CrossRef Cited-by
1. Brenda Juárez-Juárez, Sergio Alejandro Rojas-Hernández, Manuel Eduardo Silva-Rivera, Juan Pablo Landaverde-Neri. (2019). Desarrollo de un Sistema de información para Evaluación de la Confiabilidad de Cuestionarios mediante el coeficiente de Cronbach. Revista de Tecnología Informática, , p.1. https://doi.org/10.35429/JCT.2019.9.3.1.15.
Dimensions
PlumX
Visitas a la página del resumen del artículo
Descargas
Licencia
Los autores o titulares del derecho de autor de cada artículo confieren a la Revista de la Facultad de Ciencias de la Universidad Nacional de Colombia una autorización no exclusiva, limitada y gratuita sobre el artículo que una vez evaluado y aprobado se envía para su posterior publicación ajustándose a las siguientes características:
1. Se remite la versión corregida de acuerdo con las sugerencias de los evaluadores y se aclara que el artículo mencionado se trata de un documento inédito sobre el que se tienen los derechos que se autorizan y se asume total responsabilidad por el contenido de su obra ante la Revista de la Facultad de Ciencias, la Universidad Nacional de Colombia y ante terceros.
2. La autorización conferida a la revista estará vigente a partir de la fecha en que se incluye en el volumen y número respectivo de la Revista de la Facultad de Ciencias en el Sistema Open Journal Systems y en la página principal de la revista (https://revistas.unal.edu.co/index.php/rfc/index), así como en las diferentes bases e índices de datos en que se encuentra indexada la publicación.
3. Los autores autorizan a la Revista de la Facultad de Ciencias de la Universidad Nacional de Colombia para publicar el documento en el formato en que sea requerido (impreso, digital, electrónico o cualquier otro conocido o por conocer) y autorizan a la Revista de la Facultad de Ciencias para incluir la obra en los índices y buscadores que estimen necesarios para promover su difusión.
4. Los autores aceptan que la autorización se hace a título gratuito, por lo tanto renuncian a recibir emolumento alguno por la publicación, distribución, comunicación pública y cualquier otro uso que se haga en los términos de la presente autorización.
5. Todos los contenidos de la Revista de la Facultad de Ciencias, están publicados bajo la Licencia Creative Commons Atribución – No comercial – Sin Derivar 4.0.
MODELO DE CARTA DE PRESENTACIÓN y CESIÓN DE DERECHOS DE AUTOR