Publicado

2017-07-01

Statistical metadata in knowledge discovery

Metadatos estadísticos en el descubrimiento de conocimiento

Palabras clave:

statistical metadata, knowledge discovery, knowledge management, data analytics (en)
metadatos estadísticos, descubrimiento de conocimiento, gestión de conocimiento, analítica de datos (es)

Autores/as

Metadata represents the semantic schema of the data collected over the years by an organization in order to apply the business intelligence approach.  However, the metadata normally collected are not enough to facilitate knowledge discovery processes because they are conceived, primarily, for the interoperability between information systems. Research undertaken in this study confirmed the need to enrich data warehousing systems with structured meaningful metadata in order to increase the productivity and efficacy of any investigation, including data management and future business analytics. This need led us to adopt and extend the concept of “statistical metadata”. Thus, our proposed conceptual model of statistical metadata not only considers recognized standards, but also represents other additional properties. This means that our conceptual model allows increased levels of detail about the data and quality of the semantic contents.
Los metadatos representan el esquema semántico de los datos recolectados a lo largo de los años por una organización para aplicar el enfoque de inteligencia de negocios. Sin embargo, los metadatos normalmente recopilados no son suficientes para facilitar los procesos de descubrimiento de conocimiento porque están concebidos, principalmente, para la interoperabilidad entre sistemas de información. La investigación realizada en este estudio confirmó la necesidad de enriquecer los sistemas de almacenamiento de datos con metadatos significativos y estructurados con el fin de aumentar la productividad y la eficacia de cualquier investigación, incluida la gestión de datos y la analítica futura del negocio. Esta necesidad nos llevó a adoptar y ampliar el concepto de "metadatos estadísticos". Por lo tanto, nuestro modelo conceptual propuesto de metadatos estadísticos no sólo considera estándares reconocidos, sino que también representa otras propiedades adicionales. Esto significa que nuestro modelo conceptual permite mayores niveles de detalle sobre los datos y la calidad de los contenidos semánticos.

Descargas

Los datos de descargas todavía no están disponibles.

Citas

Loshin, D., Business intelligence and information exploitation, in Business Intelligence: The Savvy Manager’s Guide, 2a ed., Ed. MA, USA: Morgan Kaufmann, 2013, pp. 1-13. DOI: 10.1016/B978-0-12-385889-4.00001-6

ESSnet-Data warehouse, Metadata framework for statistical data warehousing, MEETS ESSnet projects-European Commission, 2013. [Online]. Available at: http://ec.europa.eu/eurostat/cros/content/dwh-sga2-wp1-11-metadata-framework-statistical-data-warehousing-v112-final_en.

Robledo, J., Malaver, F. y Vargas, M., Encuestas, datos y descubrimiento de conocimiento sobre la innovación en Colombia, 1st ed., Bogotá: Javegraf, 2009.

Dippo, C.S. and Sundgren, B., The role of metadata in statistics, International Conference on Establishment Surveys II, [online]. 2000, pp. 1-12. Available at: http://www.bls.gov/ore/abstract/st/st0000 40.htm

Gartner, Magic quadrant for metadata management solutions, [online]. 2017. Available at: https://www.gartner.com/doc/3778891/magic-quadrant-metadata-management-solutions

Sigmon, P.W., Getting started with information governance: The glossary approach, IBM Data Management Magazine, [online]. 2013. Available at: http://www.ibmbigdatahub.com/blog/getting-started-information-governance-glossary-approach

Fryman, L., Lampshire, G. and Meers, D., Aligning the language of business: The Business glossary, in The Data and Analytics Playbook, Eds. Boston: Morgan Kaufmann, 2017, pp. 137-157. DOI: 10.1016/B978-0-12-802307-5.00005-8

Inmon, W.H., Strauss, D. and Neushloss, G., DW 2.0: The architecture for the next generation of data warehousing. Morgan Kaufman Series in Data Management Systems, 2008. DOI: 10.1016/B978-0-12-374319-0.00002-6

NISO, Understanding Metadata, 1st ed. MD, USA: National Information Standards Organization, [online]. 2004. Available at: http://hdl.handle.net/10150/105486

Berners-Lee, T., Web architecture: Metadata, 1997. [Online]. Available at: https://www.w3.org/DesignIssues/Metadata.html. [Accessed: 15-Jul-2017].

UNECE, CMF Part A - Statistical metadata in a corporate context: A guide for managers, Geneva: United Nations, [online]. 2009. Available at: https://statswiki.unece.org/display/metis/Part+A+-+Statistical+Metadata+in+a+Corporate+Context

Sundgren, B., Guidelines for the modeling of statistical data and metadata, Geneva: United Nations Statistical Commission and Economic Commission for Europe, 1995. [Online] Available at: http://www.unece.org/fileadmin/DAM/stats/publications/metadatamodeling.pdf. [Accessed: 15-Jul-2017].

OECD, OECD Glossary of statistical terms. Paris: OECD Publishing, 2008. DOI: 10.1787/9789264055087-en

Westlake, A., Models and metadata, in Proceedings of the Final MetaNet Conference, Ed. Greece: University of Athens, 2003, pp. 108-117. [Online] Available at: http://www.data-archive.ac.uk/media/1689/METANET_proceedings_finalreport.pdf. [Accessed: 15-Jul-2017].

DATA.GOV.UK, Statistics on Obesity, Physical Activity and Diet, England - Datasets, Datasets, 2015. [Online]. [Accessed: 1-Dec-2016]. Available at: https://data.gov.uk/dataset/statistics_on_obesity_physical_activity_and_diet_england.

Batini, C. and Scannapieco, M., Data quality: Concepts, methodologies and techniques, 1st ed., NY, USA: Springer Berlin Heidelberg, 2006. DOI: 10.1007/3-540-33173-5

Weisberg, H.I., Bias and causation: Models and judgment for valid comparisons. Wiley Blackwell, 2010. DOI: 10.1002/9780470631102

Jiménez, C., Villa, F. Rico, M., Metadatos de una bodega de datos para descubrir conocimiento, en: Encuestas, datos y descubrimiento de conocimiento sobre la innovación en Colombia, 1st ed., Javegraf, 2009, pp. 33-51.

Rodríguez, A., Soporte para el diagnóstico de sepsis en adultos, usando técnicas de minería de datos supervisadas, MSc. Thesis, Universidad Nacional de Colombia, Medellín, Colombia, 2015.

Pereira, J.M., Paiva, J.A. and Rello, J., Severe sepsis in community-acquired pneumonia — Early recognition and treatment. Eur. J. Intern. Med., 23(5), pp. 412-419, 2012. DOI: 10.1016/j.ejim.2012.04.016

Grossmann, W., Structures for metadata, in metanet work package 1: Methodology and Tools, Ed. The MetaNet Project, [online]. 2002, pp. 11-28. Available at: http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.203.5184&rep=rep1&type=pdf. [Accessed: 15-Jul-2017].

Object Management Group, OMG Unified Modeling Language (OMG UML) - version 2.5, [online]. 2015. Available at: http://www.omg.org/spec/UML/2.5/. [Accessed: 15-Jul-2017].

Inmon, W.H., O’Neil, B. and Fryman, L., Business metadata: Capturing enterprise knowledge, San Francisco, USA: Morgan Kaufmann Publishers Inc., [online]. 2008. Available at: https://www.elsevier.com/books/business-metadata-capturing-enterprise-knowledge/inmon/978-0-12-373726-7