Published

2016-01-01

Regresión por mínimos cuadrados parciales PLS con datos de intervalo

Partial least squares regression PLS on interval data

DOI:

https://doi.org/10.15446/rev.fac.cienc.v5n1.54616

Keywords:

Regresión por componentes principales, mínimos cuadrados parciales PLS, optimización intervalo-valuada, intervalo valores y vectores propios (es)
Principal components regression, partial least squares regression PLS, interval-valued optimization, interval eigen values and eigen vectors (en)

Authors

  • Carlos Alberto Gaviria Peña Universidad San Buenaventura https://orcid.org/0000-0003-1450-718X
  • Raúl Alberto Pérez Agámez Universidad Nacional de Colombia, sede Medellín
  • María Eugenia Puerta Yepes Universidad EAFIT

La incertidumbre en los datos puede ser considerada mediante un intervalo numérico en el cual una variable puede asumir sus posibles valores, esto se conoce como datos de intervalo. En este artículo se extiende la metodología de regresión PLS al caso donde tanto las variables explicativas como las variables respuesta y los coeficientes de regresión son del tipo intervalo. De ésta manera se propone una metodología de regresión que resuelve tres problemas que se presentan con los datos de tipo real: en primer lugar problemas de multicolinealidad tanto en las variables explicativas como en las variables respuesta, en segundo lugar problemas cuando los datos no pertenecen a un espacio Euclídeo y por último problemas cuando la incertidumbre en los datos se representa por medio de intervalos. Hoy en día existen tareas del común, tales como planificación y operación de sistemas eléctricos, planificación de producción, logística del transporte, inventarios, gestión de carteras de valores, entre otras, que involucran incertidumbre. De ésta manera se requieren modelos que tengan en cuenta dicha incertidumbre y puedan dar la posibilidad de tomar decisiones para resultados óptimos desde una gama de posibilidades o escenarios posibles. Por otro lado, el análisis de datos reales a menudo se ve afectado por diferentes tipos de errores tales como: errores de medición, errores de cálculo e impresición relacionada con el método adoptado para la estimación de los datos. Este trabajo es una propuesta metodológica de tipo teórico y está fundamentada en los desarrollos teóricos sobre optimización matemática sobre los conjuntos de multi-intervalos y multi-matrices.

Uncertainty in the data can be considered as a numerical interval in which a variable can assume its possible values, this has been known as interval data. In this paper the $PLS$ regression methodology is extended to the case where explanatory, response variables and coefficients regression are intervals. In this way a regression methodology solves three problems encountered with actual data type is proposed: first multicollinearity in explanatory and response variables, second real data does not belong to a Euclidean space and finally, problems when uncertainty in the data is represented by intervals.  Today there are common tasks, such as planning and operation of electrical systems, production planning, transport logistics, inventory, management of securities portfolios; among others, involving uncertainty; this way models that take into account and the ability to make decisions for optimal results from a range of possibilities or scenarios are required. Furthermore, the analysis of real data is affected by different types of errors as measurement errors, miscalculations and imprecision related to the method adopted for estimating data. This paper is a methodological proposal of theoretical type and is based on development about mathematical optimization on multi-interval and multi-matrix spaces.

References

Billard, L.; Diday, E. (2000). Regression Analysis for Interval-Valued Data. Data analysis, Classicaiton, and Related Methods. eds. H.A.L. Kiers, J.-P. Rassoon, P.J.F.Groenen, and M. Schader, Springer-Verlag, Berlin. 369-374.

Billard, L.; Diday, E. (2007). Symbolic Data Analysis: Conceptual Statistics and Data Mining. Wiley, Chichester. 295-306.

De Carvalho, F.A.T Et. al. (2004). A New Method to Fit a Linear Regression Model for Intervalvalued Data, Springer-Verlag, Berlin. 295-306.

Federica, G.; Carlo, N. (2006). Principal components analysis on interval data . Computational Statistic. 21. 343-363.

Fernandez, J.P (2008). Optimizacion multi-objetivo intervalo valuada. Thesis of Master. Universidad EAFIT.

Gallego-Posada, J.D; Puerta-Yepes, M.E. (2015). Interval Analysis and Optimization Applied to Parameter Estimation under Uncertainty. Preprint.

Gioia, F.; Lauro, C. (2005). Basic Statistical Methods for Interval Data. Statistica Applicata. 17. In press.

Grant, M.; Boyd, S. (2000). Graph implementations for nonsmooth convex programs Recent Advances in Learning and Control, Springer-Verlag, Limited.

Hardy, G. (1916). Weierstrass non-dierentiable function. Transactions of the American Mathe-matical Society, 17, 301.

Hladik, M., et al. (2008). An Algorithm for the Real Interval Eigenvalue Problem. Institut National of de Recherche en Informatique et en Automatique, 6680, 1-28.

Hladik, M., et al. (2009). Bounds on eigenvalues and singular values of interval matrices. Institut National of de Recherche en Informatique et en Automatique, 1234, 1-18.

Hladik, M., et al. (2011). Characterizing and approximating eigenvalue sets of symmetric interval matrices. Computers and Mathematics with Applications, 62, 3152-3163.

I.CVX Research (2012). CVX: Matlab software for disciplined convex programming, version 2.0.http://cvxr.com/cvx.

Moore, R., et al. (2009). Introduction to Interval Analysis. Society for Industrial and Applied Mathematics, Philadelphia.

Neto, E.A, Et. al. (2004). Univariate and Multi-variate Linear Regression Methods to Predict Interval-valued Features, Springer-Verlag, Berlin. 526-537.

Neto, E.A, Et. al. (2010). Constrained Linear Regression Models for Symbolic Interval-valued Variables, Computational Statistics and Data Analysis. 54(2). 333-347.

Neto, E.A, Et. al. (2005). Applying Constrained Linear Aggression Models to Predict Interval-Valued Data, Springer-Verlag,Berlin. 92-106.

Radstrom, H. (1953). An embedding theorem for spaces of convex sets. American MAthematical Society, 3, 165-169.

Rhon, J. (1993). Interval Matrices: Singularity and Real Eigenvalues. Society for Industrial and Applied Mathematics, 14, 82-91.

Rhon, J. (2011). Inverse Interval Matrix: A Survey. Electronic Journal in Linear Algebra, 22, 704-719.

Storn, R. & Price, K. (1997). Dierential evolution-a simple and ecient heuristic for global optimization over continuous spaces. Jornal of Global Optimization, 11, 341-359.

Stoyanov (2014). Eigenvalues of Symmetric Interval Matrices. Thesis of Master. Charles University in Praga.

Wold, H. (1975). Soft Modeling byLatent Variables; The Non-linear Iterative Partial Least Squares Approach. Perspectives in Probability and Statistics, , 1-2.

Wold, H. (1985). Partial Least Sqaures. Encyclopedia of Statistical Sciences, 6, 581-591.

Wold, H. (2001). Personal Memories of the early PLS Development. Chemometrics and Intelligent Laboratory Sistems, 58, 109-130.

Wold, H. (1982). Estimation of Principal Components and Related Models by Iterative Least Squares. In Krishnaiah, P(ed.), Multivariate Analysis, Academic Press. New York. 391-420.

Wold, S. et al. (1984). Multivariate Data Analysis in Chemestry, in Chemometrics, Mathematics and Statistics in Chemestry. Reidel Publishing Company. Dordrecht. 17-18.

How to Cite

APA

Gaviria Peña, C. A., Pérez Agámez, R. A. and Puerta Yepes, M. E. (2016). Regresión por mínimos cuadrados parciales PLS con datos de intervalo. Revista de la Facultad de Ciencias, 5(1), 148–159. https://doi.org/10.15446/rev.fac.cienc.v5n1.54616

ACM

[1]
Gaviria Peña, C.A., Pérez Agámez, R.A. and Puerta Yepes, M.E. 2016. Regresión por mínimos cuadrados parciales PLS con datos de intervalo. Revista de la Facultad de Ciencias. 5, 1 (Jan. 2016), 148–159. DOI:https://doi.org/10.15446/rev.fac.cienc.v5n1.54616.

ACS

(1)
Gaviria Peña, C. A.; Pérez Agámez, R. A.; Puerta Yepes, M. E. Regresión por mínimos cuadrados parciales PLS con datos de intervalo. Rev. Fac. Cienc. 2016, 5, 148-159.

ABNT

GAVIRIA PEÑA, C. A.; PÉREZ AGÁMEZ, R. A.; PUERTA YEPES, M. E. Regresión por mínimos cuadrados parciales PLS con datos de intervalo. Revista de la Facultad de Ciencias, [S. l.], v. 5, n. 1, p. 148–159, 2016. DOI: 10.15446/rev.fac.cienc.v5n1.54616. Disponível em: https://revistas.unal.edu.co/index.php/rfc/article/view/54616. Acesso em: 23 jul. 2024.

Chicago

Gaviria Peña, Carlos Alberto, Raúl Alberto Pérez Agámez, and María Eugenia Puerta Yepes. 2016. “Regresión por mínimos cuadrados parciales PLS con datos de intervalo”. Revista De La Facultad De Ciencias 5 (1):148-59. https://doi.org/10.15446/rev.fac.cienc.v5n1.54616.

Harvard

Gaviria Peña, C. A., Pérez Agámez, R. A. and Puerta Yepes, M. E. (2016) “Regresión por mínimos cuadrados parciales PLS con datos de intervalo”, Revista de la Facultad de Ciencias, 5(1), pp. 148–159. doi: 10.15446/rev.fac.cienc.v5n1.54616.

IEEE

[1]
C. A. Gaviria Peña, R. A. Pérez Agámez, and M. E. Puerta Yepes, “Regresión por mínimos cuadrados parciales PLS con datos de intervalo”, Rev. Fac. Cienc., vol. 5, no. 1, pp. 148–159, Jan. 2016.

MLA

Gaviria Peña, C. A., R. A. Pérez Agámez, and M. E. Puerta Yepes. “Regresión por mínimos cuadrados parciales PLS con datos de intervalo”. Revista de la Facultad de Ciencias, vol. 5, no. 1, Jan. 2016, pp. 148-59, doi:10.15446/rev.fac.cienc.v5n1.54616.

Turabian

Gaviria Peña, Carlos Alberto, Raúl Alberto Pérez Agámez, and María Eugenia Puerta Yepes. “Regresión por mínimos cuadrados parciales PLS con datos de intervalo”. Revista de la Facultad de Ciencias 5, no. 1 (January 1, 2016): 148–159. Accessed July 23, 2024. https://revistas.unal.edu.co/index.php/rfc/article/view/54616.

Vancouver

1.
Gaviria Peña CA, Pérez Agámez RA, Puerta Yepes ME. Regresión por mínimos cuadrados parciales PLS con datos de intervalo. Rev. Fac. Cienc. [Internet]. 2016 Jan. 1 [cited 2024 Jul. 23];5(1):148-59. Available from: https://revistas.unal.edu.co/index.php/rfc/article/view/54616

Download Citation

CrossRef Cited-by

CrossRef citations1

1. Brenda Juárez-Juárez, Sergio Alejandro Rojas-Hernández, Manuel Eduardo Silva-Rivera, Juan Pablo Landaverde-Neri. (2019). Desarrollo de un Sistema de información para Evaluación de la Confiabilidad de Cuestionarios mediante el coeficiente de Cronbach. Revista de Tecnología Informática, , p.1. https://doi.org/10.35429/JCT.2019.9.3.1.15.

Dimensions

PlumX

Article abstract page views

1181

Downloads

Download data is not yet available.