<?xml version="1.0" encoding="utf-8"?>
<!DOCTYPE article
  PUBLIC "-//NLM//DTD JATS (Z39.96) Journal Publishing DTD v1.0 20120330//EN" "http://jats.nlm.nih.gov/publishing/1.0/JATS-journalpublishing1.dtd">
<article article-type="research-article" dtd-version="1.0" specific-use="sps-1.6" xml:lang="es" xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xlink="http://www.w3.org/1999/xlink">
	<front>
		<journal-meta>
			<journal-id journal-id-type="publisher-id">dyna</journal-id>
			<journal-title-group>
				<journal-title>DYNA</journal-title>
				<abbrev-journal-title abbrev-type="publisher">Dyna rev.fac.nac.minas</abbrev-journal-title>
			</journal-title-group>
			<issn pub-type="ppub">0012-7353</issn>
			<publisher>
				<publisher-name>Universidad Nacional de Colombia</publisher-name>
			</publisher>
		</journal-meta>
		<article-meta>
			<article-id pub-id-type="doi">10.15446/dyna.v85n205.67745</article-id>
			<article-categories>
				<subj-group subj-group-type="heading">
					<subject>Artículos</subject>
				</subj-group>
			</article-categories>
			<title-group>
				<article-title>Integración de herramientas para la toma de decisiones en la congestión vehicular</article-title>
				<trans-title-group xml:lang="en">
					<trans-title>Integration of tools for decision making in vehicular congestion</trans-title>
				</trans-title-group>
			</title-group>
			<contrib-group>
				<contrib contrib-type="author">
					<name>
						<surname>Iván-Herrera-Herrera</surname>
						<given-names>Nelson</given-names>
					</name>
					<xref ref-type="aff" rid="aff1"><sup>a</sup></xref>
				</contrib>
				<contrib contrib-type="author">
					<name>
						<surname>Luján-Mora</surname>
						<given-names>Sergio</given-names>
					</name>
					<xref ref-type="aff" rid="aff2"><sup>b</sup></xref>
				</contrib>
				<contrib contrib-type="author">
					<name>
						<surname>Gómez-Torres</surname>
						<given-names>Estevan Ricardo</given-names>
					</name>
					<xref ref-type="aff" rid="aff1"><sup>a</sup></xref>
				</contrib>
			</contrib-group>
			<aff id="aff1">
				<label>a</label>
				<institution content-type="original"> Facultad de Ciencias de la Ingeniería e Industrias, Universidad Tecnológica Equinoccial, Quito, Ecuador. nelson.herrera@ute.edu.ec, etevan.gomez@ute.edu.ec </institution>
				<institution content-type="normalized">Universidad Tecnológica Equinoccial</institution>
				<institution content-type="orgdiv1">Facultad de Ciencias de la Ingeniería e Industrias</institution>
				<institution content-type="orgname">Universidad Tecnológica Equinoccial</institution>
				<addr-line>
					<named-content content-type="city">Quito</named-content>
				</addr-line>
				<country country="EC">Ecuador</country>
				<email>nelson.herrera@ute.edu.ec</email>
				<email>etevan.gomez@ute.edu.ec</email>
			</aff>
			<aff id="aff2">
				<label>b</label>
				<institution content-type="original"> Departamento de Lenguajes y Sistemas Informáticos, Universidad de Alicante, Alicante, España. sergio.lujan@ua.es </institution>
				<institution content-type="normalized">Universidad de Alicante</institution>
				<institution content-type="orgdiv1">Departamento de Lenguajes y Sistemas Informáticos</institution>
				<institution content-type="orgname">Universidad de Alicante</institution>
				<addr-line>
					<named-content content-type="city">Alicante</named-content>
				</addr-line>
				<country country="ES">Spain</country>
				<email>sergio.lujan@ua.es</email>
			</aff>
			<pub-date pub-type="epub-ppub">
				<season>Apr-Jun</season>
				<year>2018</year>
			</pub-date>
			<volume>85</volume>
			<issue>205</issue>
			<fpage>363</fpage>
			<lpage>370</lpage>
			<history>
				<date date-type="received">
					<day>15</day>
					<month>09</month>
					<year>2017</year>
				</date>
				<date date-type="rev-recd">
					<day>15</day>
					<month>03</month>
					<year>2018</year>
				</date>
				<date date-type="accepted">
					<day>21</day>
					<month>03</month>
					<year>2018</year>
				</date>
			</history>
			<permissions>
				<license license-type="open-access" xlink:href="http://creativecommons.org/licenses/by-nc-nd/4.0/" xml:lang="es">
					<license-p>Este es un artículo publicado en acceso abierto bajo una licencia Creative Commons</license-p>
				</license>
			</permissions>
			<abstract>
				<title>Resumen</title>
				<p>Este estudio tiene como finalidad presentar un análisis de la utilización e integración de herramientas tecnológicas que ayudan a tomar decisiones en situaciones de congestión vehicular. La ciudad de Quito-Ecuador es considerada como un caso de estudio para el trabajo realizado. La investigación se presenta en función del desarrollo de una aplicación, haciendo uso de herramientas <italic>Big Data</italic> (Apache Flume, Apache Hadoop, Apache Pig), que permiten el procesamiento de gran cantidad de información que se requiere recolectar, almacenar y procesar. Uno de los aspectos innovadores de la aplicación es el uso de la red social Twitter como fuente de origen de datos. Para esto se utilizó su interfaz de programación de aplicaciones (<italic>Application Programming Interface</italic>, API), la cual permite tomar datos de esta red social en tiempo real e identificar puntos probables de congestión. Este estudio presenta resultados de pruebas realizadas con la aplicación, durante un período de 9 meses.</p>
			</abstract>
			<trans-abstract xml:lang="en">
				<title>Abstract</title>
				<p>The purpose of this study is to present an analysis of the use and integration of technological tools that help decision making in situations of vehicular congestion. The city of Quito-Ecuador is considered as a case study for the done work. The research is presented according to the development of an application, using Big Data tools (Apache Flume, Apache Hadoop, Apache Pig), favoring the processing of a lot of information that is required to collect, store and process. One of the innovative aspects of the application is the use of Twitter social network as source of origin. For this, it used its application programming interface (API), which allows to take data from this social network and identify probable points of congestion. This study presents results of tests carried out with the application, in a period of 9 months.</p>
			</trans-abstract>
			<kwd-group xml:lang="en">
				<title>Keywords:</title>
				<kwd>congestion</kwd>
				<kwd>traffic</kwd>
				<kwd>Twitter</kwd>
				<kwd>big data</kwd>
				<kwd>application</kwd>
				<kwd>Quito</kwd>
			</kwd-group>
			<kwd-group xml:lang="es">
				<title>Palabras clave:</title>
				<kwd>congestión</kwd>
				<kwd>tráfico</kwd>
				<kwd>Twitter</kwd>
				<kwd>big data</kwd>
				<kwd>aplicación</kwd>
				<kwd>Quito</kwd>
			</kwd-group>
			<counts>
				<fig-count count="9"/>
				<table-count count="2"/>
				<equation-count count="0"/>
				<ref-count count="21"/>
				<page-count count="8"/>
			</counts>
		</article-meta>
	</front>
	<body>
		<sec sec-type="intro">
			<title>1. Introducción</title>
			<p>La dinámica de las grandes ciudades genera situaciones complejas y difíciles de abordar. Entre estas situaciones se tiene la alta densidad poblacional en espacios geográficos muy estrechos y sin posibilidades de crecimiento urbano. </p>
			<p>La ciudad de Quito es la capital del Ecuador, siendo esta el centro económico del país, donde se desarrollan actividades comerciales, administrativas y turísticas. Debido a su gran expansión poblacional, la ciudad ha experimentado grandes cambios, que ha tenido como consecuencia del problema de congestión vehicular [<xref ref-type="bibr" rid="B1">1</xref>].</p>
			<p>Entre las principales causas de la congestión vehicular <xref ref-type="fn" rid="fn1"><sup>1</sup></xref> están las características topográficas de la ciudad, ya que cuenta con grandes montañas al lado occidental y desniveles y valles al lado oriental. Esta situación ha generado, que la ciudad se expanda en dirección norte - sur, es decir de forma alargada y con muy poca organización y planificación [<xref ref-type="bibr" rid="B2">2</xref>], sumadas a un explosivo crecimiento del parque automotor, han agudizado aún más el problema [<xref ref-type="bibr" rid="B2">2</xref>].</p>
			<p>A través del tiempo han existido importantes iniciativas de movilidad en la ciudad, incluyéndose sistemas de control de tránsito, monitoreo, construcción de vías perimetrales, e inclusive la medida “pico y placa” para restringir el uso vehicular en horas pico, de acuerdo a la placa del vehículo [<xref ref-type="bibr" rid="B3">3</xref>]. Cabe mencionar que esta alternativa ha sido una iniciativa que se ha adoptado en varios países de América Latina. Sin embargo, todas estas iniciativas no han sido suficientes y la congestión aumenta cada vez más, generando malestar en la ciudadanía.</p>
			<p>Con base a esta problemática, se necesita una aplicación que permita: recolectar, almacenar, procesar y visualizar información no estructurada en tiempo real; lo cual sirve de soporte a la toma de decisiones, en situaciones de congestión vehicular, tanto a nivel de entidades oficiales como de personas. </p>
			<p>Esta aplicación hace uso de dos grupos principales de datos, los datos sensoriales y sociales. Para el primer tipo de datos, se considera los recopilados a través de sensores, que miden el flujo vehicular en sectores estratégicos, colocados a lo largo de la ciudad. Para lo cual un agente de tránsito por experiencia, determina que puntos son propensos a generar congestión y por lo tanto donde se los deben colocar. El otro grupo de datos hace uso de información pública, existente a través de las redes sociales, en este caso, Twitter. </p>
			<p>La información disponible de sensores del volumen de tráfico, así como de las redes sociales, se procesará mediante una aplicación creada para ello. Posteriormente se presentarán los resultados de este análisis, que servirá de apoyo a la toma de decisiones, en situaciones de congestión vehicular.</p>
			<p>En un trabajo previo [<xref ref-type="bibr" rid="B4">4</xref>], se realizó un análisis de los factores que influyen en la congestión vehicular en Quito; además del estudio de la cuestión acerca de herramientas tecnológicas, que han ido utilizadas alrededor del mundo, como una alternativa de solución a este problema. </p>
			<p>El presente artículo está orientado a la presentación técnica de la aplicación y sus componentes; sin embargo el estudio realizo incluye todos los elementos formales de una investigación. En este sentido, partiendo desde el planteamiento del problema, hasta las conclusiones y recomendaciones, se efectuó la fundamentación teórica respaldada en el análisis del uso de técnicas y estrategias utilizadas mundialmente relacionadas el tráfico vehicular.</p>
			<p>Los aspectos metodológicos del presente trabajo se orientaron a una investigación de campo para conocer, a través de la aplicación de instrumentos, la percepción de la población sobre la congestión y el uso de redes sociales. </p>
			<p>Los hallazgos de la investigación de campo proporcionaron información mediante la cual se logró fundamentar de mejor manera la presente propuesta que a continuación se detalla. </p>
			<p>El presente trabajo tiene el contexto de una investigación Big Data [<xref ref-type="bibr" rid="B5">5</xref>], pues los elementos de esta tecnología se conjugan perfectamente:</p>
			<p><bold>
 <italic>Volumen:</italic> 
</bold> miles de datos serán generados mediante la red social Twitter y la proporcionada por los sensores instalados en la ciudad.</p>
			<p><bold>
 <italic>Variedad:</italic> 
</bold> datos generados por sensores y la red social Twitter.</p>
			<p><bold>
 <italic>Velocidad:</italic> 
</bold> diariamente se generarán datos mediante la red social Twitter a una importante velocidad. Esto requiere que su procesamiento y posterior análisis, normalmente, ha de hacerse en tiempo real, para mejorar la toma de decisiones [<xref ref-type="bibr" rid="B6">6</xref>].</p>
			<p><bold>
 <italic>Veracidad:</italic> 
</bold> la información de la red social Twitter, debe ser filtrada para seleccionar, únicamente, la que sirva para el estudio. </p>
		</sec>
		<sec>
			<title>2. Trabajos relacionados</title>
			<p>Se han realizado varias investigaciones relacionadas con herramientas tecnológicas utilizadas en situaciones de congestión vehicular.</p>
			<p>
				<list list-type="bullet">
					<list-item>
						<p>Utilización de modelos macroscópicos [<xref ref-type="bibr" rid="B7">7</xref>], equipando a los vehículos con dispositivos de detección cada vez más sofisticados, como cámaras. Las personas y los vehículos están compartiendo datos de detección para mejorar la experiencia de conducción [<xref ref-type="bibr" rid="B8">8</xref>]. </p>
					</list-item>
					<list-item>
						<p>Sistemas que monitorean, procesan y almacenan grandes cantidades de datos, lo que permite detectar la congestión del tráfico de manera precisa. Para esto se utiliza una serie de algoritmos que reducen la emisión localizada de vehículos, mediante el re-encaminamiento de los automóviles [<xref ref-type="bibr" rid="B9">9</xref>].</p>
					</list-item>
					<list-item>
						<p>Utilización de sistemas de detección participativa, como Foursquare e Instagram, que se están volviendo muy populares. Los datos compartidos en estos sistemas tienen la participación activa de los usuarios mediante la utilización de dispositivos portátiles. Estos sistemas pueden ser vistos como una especie de sensores que, junto a información de condiciones de tráfico, constituyen en eficientes predictores de congestión vehicular [<xref ref-type="bibr" rid="B10">10</xref>]. </p>
					</list-item>
				</list>
			</p>
			<p>En este ámbito, otra de las redes sociales potentes que permiten realizar análisis en tiempo real, de los mensajes permitidos y poder determinar puntos de congestión vehicular, es la red social Twitter [<xref ref-type="bibr" rid="B11">11</xref>]. Otro insumo importante al momento de analizar y detectar situaciones de tráfico es la utilización de sensores inalámbricos. Estos dispositivos están ganado más atención en la detección de tráfico [<xref ref-type="bibr" rid="B12">12</xref>], por lo cual, adicional a Twitter, se utilizará también información de sensores de conteo vehicular. Esto permitirá tener dos criterios previos que, finalmente mediante contraste, ayudará a entregar información más precisa de puntos de congestión vehicular en la ciudad de Quito.</p>
		</sec>
		<sec>
			<title>3. Herramientas utilizadas</title>
			<sec>
				<title>3.1. Información de sensores</title>
				<p>Para lograr la medición del tráfico en la ciudad, el Municipio de Quito, a través de la Secretaría de Movilidad, dispone de sensores a lo largo de la localidad. </p>
				<p>La <xref ref-type="fig" rid="f1">Fig. 1</xref> muestra un ejemplo de sensores de tráfico que están ubicados en lugares estratégicos donde existe más afluencia vehicular, de acuerdo a los criterios del Municipio de Quito. Estos sensores recolectan información de la cantidad de vehículos que circulan por cada punto.</p>
				<p>
					<fig id="f1">
						<label>Figura 1</label>
						<caption>
							<title>Sensores en la ciudad.</title>
						</caption>
						<graphic xlink:href="0012-7353-dyna-85-205-00363-gf1.png"/>
						<attrib><bold>Fuente:</bold> Tomado de [<xref ref-type="bibr" rid="B2">2</xref>].</attrib>
					</fig>
				</p>
				<p>Adicionalmente, el Municipio de Quito dispone de parámetros que corresponden a valores preestablecidos de acuerdo al sector, donde se establece una cantidad límite máxima. Si el número de vehículos sobrepasa este valor<bold>,</bold> esto implica que el lugar se encuentra congestionado. </p>
				<p>La aplicación que se ha desarrollado y se presenta, genera información útil que establece posibles puntos de congestión vehicular; mediante el análisis de datos generados por sensores y; la correlación con la información presentada en base a tuits recolectados en un determinado momento. La información se presenta en un mapa elaborado para la investigación, que utiliza el API de Google Maps; los puntos de congestión que puedan ser analizados, con lo cual se establecen sectores de mayor tráfico y, a su vez, horas pico. Finalmente, mediante estos resultados se pueda tomar decisiones de cambio de ruta y comunicarlas a la ciudadanía, a efectos de aliviar la congestión vehicular existente.</p>
			</sec>
			<sec>
				<title>3.2. Datos de Twitter</title>
				<p>La segunda fuente de datos considerada para el análisis corresponde a los datos que proporcionan las personas al hacer uso de la red social Twitter. Se requiere tener una cuenta en Twitter, además de ser necesaria la activación del servicio de GPS en el teléfono inteligente o tableta. Esta red social genera información variada y, por tanto, es utilizada con diversos propósitos, uno de ellos es estimar el tráfico existente en la ciudad. Por lo que los tuits que se generan a todas horas tienen una geolocalización, que permite identificar el origen del mismo. Para lo cual se hace uso del API de Twitter que se detalla a continuación.</p>
			</sec>
			<sec>
				<title>3.3. Uso del API de Twitter</title>
				<p>Para poder utilizar el API de Twitter es necesario tener una cuenta en esta red social y crear otra adicional de desarrollador, la versión utilizada es la 1.0 [<xref ref-type="bibr" rid="B13">13</xref>]. La aplicación se ha habilitado para la lectura de tuits; sin embargo, la misma permite la publicación de los mismos en caso de ser requerido, para lo cual se habilita la escritura en las opciones de la misma.</p>
				<p>Se debe considerar que Twitter debe estar configurado en el teléfono inteligente o tableta, además del GPS. El cual en la mayor parte de casos está habilitado, por defecto.</p>
			</sec>
			<sec>
				<title>3.4. Creación del hashtag</title>
				<p>Con la finalidad de recolectar y filtrar información relacionada a la congestión generada por el tráfico vehicular en el Distrito Metropolitano de Quito, se creó la etiqueta<xref ref-type="fn" rid="fn2"><sup>2</sup></xref> #TraficoUIO. La utilización de esta etiqueta fue socializada a toda la comunidad de la Universidad Tecnológica Equinoccial (UTE). Inicialmente se recolectaron todos los tuits asociados al hashtag antes mencionado. La <xref ref-type="fig" rid="f2">Fig. 2</xref> muestra los campos que permiten a la aplicación acceder a los datos de geolocalización del tuit.</p>
				<p>
					<fig id="f2">
						<label>Figura 2</label>
						<caption>
							<title>Campos de geolocalización de un Tuit</title>
						</caption>
						<graphic xlink:href="0012-7353-dyna-85-205-00363-gf2.png"/>
						<attrib><bold>Fuente.</bold> Los autores</attrib>
					</fig>
				</p>
				<p>La configuración del tuit considera la ubicación desde la que se genera el mismo, con lo cual es posible obtener la localización del tráfico para los tuits que denuncien esta situación. </p>
				<p>La <xref ref-type="fig" rid="f3">Fig. 3</xref> detalla algunos valores asociados a un tuit, que permiten acceder a datos que muestran, por ejemplo: la ciudad, provincia, país, desde donde se generó el tuit.</p>
				<p>
					<fig id="f3">
						<label>Figura 3</label>
						<caption>
							<title>Valores asociados a un tuit</title>
						</caption>
						<graphic xlink:href="0012-7353-dyna-85-205-00363-gf3.png"/>
						<attrib><bold>Fuente.</bold> Los autores</attrib>
					</fig>
				</p>
				<p>La sección “coordinates” indica la geolocalización del tuit, que sirve para filtrar los tuits generados considerando solamente los originados en las vías, donde se ha identificado existe mayor congestión vehicular. La sección “place type” indica el tipo de lugar en el cual se están generando los tuits; el tipo indicado es una ciudad. Otra sección importante, que ayuda a delimitar los tuits generados es “country”, que indica la ciudad en la que se generan los tuits; para el presente estudio la ciudad descrita es Quito. Finalmente, la sección “name” permite identificar el lugar desde el cual se genera el tuit; el sitio de interés en el presente caso es la ciudad de Quito.</p>
			</sec>
		</sec>
		<sec sec-type="methods">
			<title>4. Metodología</title>
			<p>La revisión documental de casos de ciudades con la misma problemática permitió analizar y evaluar las aplicaciones utilizadas a nivel mundial en relación a la movilidad inteligente. </p>
			<p>En este contexto, los casos de estudio analizados y detallados en este estudio sirvieron para respaldar tanto en contenido o fundamento teórico como metodológico la presente propuesta. </p>
			<p>En la <xref ref-type="fig" rid="f4">Fig. 4</xref>, se muestra la arquitectura e integración de las fases que utilizará la aplicación de apoyo a la toma de decisiones en la congestión vehicular.</p>
			<p>
				<fig id="f4">
					<label>Figura 4</label>
					<caption>
						<title>Flujo de información del sistema.</title>
					</caption>
					<graphic xlink:href="0012-7353-dyna-85-205-00363-gf4.png"/>
					<attrib><bold>Fuente:</bold> Los autores.</attrib>
				</fig>
			</p>
			<sec>
				<title>4.1. Fase de generación</title>
				<p>Esta fase es contemplada como una entrada externa importante para la aplicación, pues aquí se generan los datos que posteriormente servirán de entrada, que alimentarán el proceso principal de la aplicación. Las fuentes generadoras de información son: red social Twitter y sensores de volumen de tráfico ubicados en ciertas intersecciones consideradas conflictivas para la congestión vehicular. La información generada por los sensores corresponde a la cantidad autos que están circulando a una distancia de tres metros a partir de la ubicación del sensor instalado, hacia adelante. La distancia establecida, obedece a la longitud promedio de un auto, que es la requerida, para que el sensor pueda detectar el movimiento vehicular.</p>
			</sec>
			<sec>
				<title>4.2. Fase de recolección</title>
				<p>En esta fase existen dos mecanismos de recolección de datos que serán utilizados por la aplicación propuesta, los cuales constituyen una importante fuente de datos primarios:</p>
				<p>
					<list list-type="bullet">
						<list-item>
							<p><italic>API Twitter</italic>, mediante el cual se obtienen mensajes que reflejan la opinión de la población, en relación a situaciones de congestión vehicular detectadas.</p>
						</list-item>
						<list-item>
							<p><italic>Sensores de volumen de tráfico</italic>, el segundo componente importante está relacionado con la información recolectada por los sensores que alimentan el Sistema de Registro Vehicular, que es manejado por el Centro de Gestión de la Movilidad (CGM) de la ciudad de Quito; en el mismo se registra la carga vehicular existente en determinadas intersecciones de la ciudad.</p>
						</list-item>
					</list>
				</p>
				<p>Para obtener la información relacionada con este componente, se realizaron varias entrevistas con autoridades del CGM de Quito, obteniéndose dos elementos importantes: conteos vehiculares y la georreferenciación de los sensores.</p>
			</sec>
			<sec>
				<title>4.3. Fase de integración</title>
				<p>Con la finalidad de agrupar los tuits generados, junto con los sensores distribuidos en la ciudad, se utilizó el método de agrupación K-means [<xref ref-type="bibr" rid="B14">14</xref>], concentrando los tuits en varios grupos dependiendo de la ubicación de los sensores. </p>
				<p>Posteriormente, se filtró el grupo de tuits generados, mediante un análisis semántico y de sentimientos [<xref ref-type="bibr" rid="B15">15</xref>], recogiendo los tuits en los que se denota malestar y cuyo texto final mencione temas de congestión vehicular.</p>
				<p>Finalmente, el grupo de tuits fue integrado con la información generada por el conteo de los sensores, para su posterior análisis y contraste de la información.</p>
			</sec>
			<sec>
				<title>4.4. Fase de análisis</title>
				<p>Con la información recolectada mediante redes sociales y sensores de congestión vehicular se obtuvieron índices de congestión. Los mismos fueron generados para cada uno de los sectores en los cuales están ubicados los sensores y alrededor de los cuales existen tuits reportando situaciones de congestión. Los índices son: </p>
				<p>
					<list list-type="bullet">
						<list-item>
							<p>RVD (retraso viaje días).</p>
						</list-item>
						<list-item>
							<p>FRv (nivel de congestión del tráfico).</p>
						</list-item>
						<list-item>
							<p>Índice de tiempo de viaje (TTI).</p>
						</list-item>
					</list>
				</p>
				<p>Posteriormente, se determinó la correlación de Pearson [<xref ref-type="bibr" rid="B16">16</xref>] entre los tres índices generados. En la <xref ref-type="table" rid="t1">Tabla 1</xref> se puede determinar si existe tráfico en cada uno de los sectores de la ciudad, mediante la aplicación de reglas de decisión.</p>
				<p>El nivel de correlación Alta, es la que se considera en la investigación, para mostrar gráficamente posibles puntos de congestión vehicular.</p>
				<p>
					<table-wrap id="t1">
						<label>Tabla 1</label>
						<caption>
							<title>Reglas de correlación y resultados</title>
						</caption>
						<graphic xlink:href="0012-7353-dyna-85-205-00363-gt1.jpg"/>
						<table-wrap-foot>
							<fn id="TFN1">
								<p><bold>Fuente.</bold> Los autores</p>
							</fn>
						</table-wrap-foot>
					</table-wrap>
				</p>
			</sec>
			<sec>
				<title>4.5. Fase de presentación</title>
				<p>Finalmente, con los datos almacenados y el procesamiento de los mismos, se ha creado una aplicación desarrollada en JSP para el <italic>backend</italic>, JQuery (Biblioteca de Java) y bootstrap para el <italic>frontend</italic>. Se utilizó Mysql como motor de base de datos y como servidor web Apache Tomcat. El entorno de desarrollo Netbean IDE. El sistema desarrollado es multinavegador y multiplataforma.</p>
				<p>El software creado permite incluir la base de datos tanto de los lugares donde existe un sensor en Quito, como de la base de datos de tuits que indican la existencia de tráfico en la ciudad. Esta herramienta web permite apreciar cartográficamente los resultados del análisis y poder determinar posibles zonas de congestión vehicular.</p>
				<p>El desarrollo del software contempló tres partes centrales que son:</p>
				<p>
					<list list-type="order">
						<list-item>
							<p>Presentación de lugares de mayor tráfico en la ciudad, considerando los datos de los sensores que dispone el Municipio de Quito.</p>
						</list-item>
						<list-item>
							<p>Presentación en tiempo real de los tuits generados en la ciudad, mediante de la red social Twitter, considerando para ello el parámetro ubicación del tuit. Sin embargo, la principal función es presentar en tiempo real el tráfico en la ciudad. </p>
						</list-item>
						<list-item>
							<p>Análisis de resultados mediante reportes tanto gráficos como analíticos de los diferentes ámbitos de análisis de tráfico en la ciudad a partir de los tuits cargados en la base de datos.</p>
						</list-item>
					</list>
				</p>
			</sec>
		</sec>
		<sec>
			<title>5. Elección de las herramientas a utilizar</title>
			<p>Para determinar la plataforma a usar en la propuesta de desarrollo, en la <xref ref-type="table" rid="t2">Tabla 2</xref> se muestra el análisis de las distintas opciones existentes.</p>
			<p>
				<table-wrap id="t2">
					<label>Tabla 2</label>
					<caption>
						<title>Indicadores de plataformas usadas para <italic>Big Data.</italic></title>
					</caption>
					<graphic xlink:href="0012-7353-dyna-85-205-00363-gt2.jpg"/>
					<table-wrap-foot>
						<fn id="TFN2">
							<p><bold>Fuente.</bold> Los autores</p>
						</fn>
					</table-wrap-foot>
				</table-wrap>
			</p>
			<p>Apache Hadoop<xref ref-type="fn" rid="fn3"><sup>3</sup></xref> es actualmente la herramienta libre más utilizada para el análisis de Big Data. Hadoop proporciona dos elementos principales: un <italic>framework MapReduce</italic> y un sistema de archivos (<italic>Hadoop Distributed File Systems</italic>, HDFS). Por un lado, el HDFS provee una base de datos tolerante a fallos con una alta disponibilidad. Por otra parte, el paradigma de programación MapReduce, permite dividir y paralelizar los cálculos entre un número indefinido de ordenadores de bajo coste. En el uso de un clúster de computadores convencionales para el análisis de datos radica una de las mayores ventajas de Apache Hadoop [<xref ref-type="bibr" rid="B17">17</xref>]. </p>
			<p>Por tanto, Hadoop proporciona una doble funcionalidad que en algunos casos las plataformas alternativas no van a poder ofrecer. Es decir, algunas de las herramientas cumplen únicamente una de las funcionalidades de Hadoop, aunque de un modo muy eficiente [<xref ref-type="bibr" rid="B17">17</xref>].</p>
			<p>La arquitectura de Hadoop permite asegurar la entrega de mecanismos de conmutación por error y recuperación; está basada en flujos de contenidos multimedia en la Web. La red social Twitter genera información que se puede recolectar mediante Apache Flume; una herramienta que toma esta información en línea y la envía a un almacén centralizado como HDFS o HBase [<xref ref-type="bibr" rid="B18">18</xref>].</p>
			<sec>
				<title>5.1. Herramientas para la obtención de datos</title>
				<p>Existe gran variedad de bibliotecas para las API de Twitter en diferentes lenguajes. Recientemente, Twitter dispone de una librería hbc; un cliente Java HTTP para consumir de Streaming API, la cual tiene como requisito introducir las respuestas en formato JSON que devuelve Streaming API dentro de Hadoop Distributed File System. Para elegir la opción más adecuada se puede realizar una comparación entre los componentes de software más comunes para este propósito, Apache: Sqoop, Kafka, Scribe y Flume [<xref ref-type="bibr" rid="B19">19</xref>].</p>
				<p>
					<list list-type="order">
						<list-item>
							<p><bold>Sqoop</bold>. Biblioteca que permite importar datos desde una base de datos estructurada, organizada en entidades que tienen un formato definido, hacia Hadoop. Permitiendo además exportar datos en sentido contrario. No se va a utilizar en el proyecto ya que no se desea importar datos desde una base de datos relacional.</p>
						</list-item>
						<list-item>
							<p><bold>Kafka.</bold> Su principal caso de uso es un sistema distribuido de paso de mensajes publicación-suscripción. Adecuado para sistemas altamente confiables y escalables de mensajería empresarial en los que se deben conectar múltiples sistemas, incluyendo Hadoop. Tampoco haremos uso de este software que no se necesita un sistema de paso de mensajes con varios tipos de sistemas informáticos.</p>
						</list-item>
						<list-item>
							<p><bold>Scribe</bold>. Está diseñado para escalar a un número muy grande de nodos y resistir a fallos en la red y en el nodo. El soporte que recibe cada vez es menor.</p>
						</list-item>
						<list-item>
							<p><bold>Flume</bold>. Servicio distribuido, seguro y con alta disponibilidad para una eficiente recolección, unión y movimiento de grandes cantidades no solo de log data, sino también de cantidades masivas de eventos de datos. Incluye tráfico de datos de red y datos generados por “social media” procedentes de fuentes de datos no relacionales.</p>
						</list-item>
					</list>
				</p>
				<p>Luego de este análisis se seleccionó Apache Flume ya que maneja datos semiestructurados como son los tuits en JSON. Una de las ventajas de esta herramienta es su estructura: simple, robusta y flexible, orientada a <italic>“Streams”</italic>; los flujos de datos se componen de agentes que pueden agregar o transformar los eventos.</p>
				<p>La misma que es una solución Java que permite recolectar y mover grandes cantidades de datos, desde algunas fuentes, principalmente servidores de aplicaciones HDSF con mayor velocidad a un espacio de almacenamiento de datos, permitiendo subir datos de Hadoop [<xref ref-type="bibr" rid="B20">20</xref>]. </p>
				<p>La instalación fue realizada en el sistema operativo Ubuntu 14.04, la <xref ref-type="fig" rid="f5">Fig. 5</xref> muestra los parámetros de configuración del agente Apache Flume<xref ref-type="fn" rid="fn4"><sup>4</sup></xref>.</p>
				<p>
					<fig id="f5">
						<label>Figura 5</label>
						<caption>
							<title>Configuración Apache Flume</title>
						</caption>
						<graphic xlink:href="0012-7353-dyna-85-205-00363-gf5.png"/>
						<attrib><bold>Fuentes.</bold> Los autores.</attrib>
					</fig>
				</p>
				<p>Los campos utilizados para la configuración son: </p>
				<p><bold>TwitterAgent.sources.Twitter.keywords:</bold> esta configuración está dividida en dos grupos que son: keywords y hashtag. Los hashtags son los utilizados por el centro de gestión de la movilidad, por ello se los consideró.</p>
				<p><bold>TwitterAgent.sources.Twitter.locations:</bold> en esta configuración se colocó los puntos cardinales de la ciudad de Quito.</p>
				<p><bold>TwitterAgent.sinks.hdfs.pathTwitter.locations:</bold> dentro de esta configuración se colocó la ruta en donde se almacenarán los tuits recolectados.</p>
				<p>En la <xref ref-type="fig" rid="f6">Fig. 6</xref>, se muestra la ejecución del agente Flume<italic>,</italic> que tomará la información de tuits relacionados con situaciones de congestión vehicular, reportados por los ciudadanos.</p>
				<p>
					<fig id="f6">
						<label>Figura 6</label>
						<caption>
							<title>Pantalla de ejecución del agente Flume</title>
						</caption>
						<graphic xlink:href="0012-7353-dyna-85-205-00363-gf6.png"/>
						<attrib><bold>Fuente.</bold> Los autores</attrib>
					</fig>
				</p>
			</sec>
			<sec>
				<title>5.2. Herramientas para el almacenamiento de datos</title>
				<p>Para el almacenamiento de los datos y acorde con el análisis anterior, se ha seleccionado Apache Hadoop. Éste es un <italic>framework</italic> de software, que permite a las aplicaciones trabajar con miles de nodos. También es de licencia libre y se instaló la versión 2.6.0.</p>
				<p>La <xref ref-type="fig" rid="f7">Fig. 7</xref> muestra la información de tuits almacenados en el sistema de archivos de Haddop, se puede apreciar los permisos, el grupo, el tamaño y el nombre de cada uno de ellos.</p>
				<p>
					<fig id="f7">
						<label>Figura 7</label>
						<caption>
							<title>Recolección de tweets almacenados en Hadoop</title>
						</caption>
						<graphic xlink:href="0012-7353-dyna-85-205-00363-gf7.png"/>
						<attrib><bold>Fuente.</bold> Los autores</attrib>
					</fig>
				</p>
			</sec>
			<sec>
				<title>5.3. Herramientas para el procesamiento de datos</title>
				<p>A continuación, se realizará una comparación entre los componentes de software más comunes para analizar el conjunto de datos JSON almacenados en bruto, que contiene HDFS. Las herramientas son: Hive (Apache Hive), Cascading (Cascading.) y Pig (Apache Pig). Para investigación sobre datos en bruto son mejores los lenguajes procedimentales [<xref ref-type="bibr" rid="B19">19</xref>].</p>
				<p>
					<list list-type="bullet">
						<list-item>
							<p><bold>Cascading</bold>. Framework de procesamiento de datos procedimental que permite a los usuarios construir flujos de datos en Java sobre Hadoop. Usa MapReduce para ejecutar todo su procesamiento de datos. Proporciona una librería de operadores, aunque también se pueden construir unos propios [<xref ref-type="bibr" rid="B19">19</xref>].</p>
						</list-item>
						<list-item>
							<p><bold>Pig</bold>. Motor para ejecutar flujos de datos en paralelo sobre Hadoop. Usa MapReduce para ejecutar todo su procesamiento de datos. Para expresar estos flujos de datos utiliza el lenguaje procedimental Pig Latin. El cual incluye operadores tradicionales como join, sort, filter, etc. así como la posibilidad para los programadores de desarrollar sus propias funciones de lectura, procesamiento y escritura de datos [<xref ref-type="bibr" rid="B19">19</xref>].</p>
						</list-item>
					</list>
				</p>
				<p>Tanto Cascading como Pig son adecuados para Twitter Data Collection pero, finalmente, se ha escogido Pig ya que tiene más compatibilidades con todo el entorno Hadoop.</p>
				<p>Pig Latin es un lenguaje de flujo de datos. Permite a los usuarios escribir cómo los datos de una o más entradas deben ser leídos, procesados y almacenados en una o más salidas en paralelo. Pig al igual que MapReduce, está orientado al procesamiento por lotes de grandes porciones del conjunto total de datos. Lee todos los registros de un archivo y escribe todas sus salidas secuencialmente. [<xref ref-type="bibr" rid="B19">19</xref>]</p>
				<p>Se ha considerado el uso de Apache Pig para el procesamiento de datos, debido a que esta aplicación es un lenguaje de procedimientos que permite la consulta de grandes conjuntos de datos semiestructurados haciendo uso de Hadoop. La versión que se utilizó de Apache Pig es pig-0.16.0 </p>
			</sec>
		</sec>
		<sec sec-type="results">
			<title>6. Resultados</title>
			<sec>
				<title>6.1. Información presentada por los sensores en Quito</title>
				<p>Con el análisis de los valores presentados por los sensores y la relación con el parámetro de tráfico establecido por el CGM, la <xref ref-type="fig" rid="f8">Fig. 8</xref> presenta cartográficamente posibles puntos de congestión vehicular en la ciudad de Quito, que corresponden al tráfico existente en el sector norte de la ciudad en el horario de 6:00 am a 7:00 am.</p>
				<p>
					<fig id="f8">
						<label>Figura 8</label>
						<caption>
							<title>Mapa de tráfico de la ciudad de Quito (sensores)</title>
						</caption>
						<graphic xlink:href="0012-7353-dyna-85-205-00363-gf8.png"/>
						<attrib><bold>Fuente.</bold> Los autores</attrib>
					</fig>
				</p>
				<p>Como se puede observar, existen dos arterias principales donde existe tráfico vehicular que son la Av. Prensa - Diego de Vásquez y la 10 de agosto. Además, se observa tráfico en la Panamericana Norte y en la Av. Eloy Alfaro, con ello es claramente identificable los tramos donde existe congestión vehicular. El gráfico presentado corresponde a solamente un segmento de la ciudad; sin embargo, se puede observar que existe una simetría en los datos. Esto se debe a que los sensores no se encuentran a lo largo de toda la ciudad; solamente se encuentran en vías específicas que han sido consideradas más transitadas. Pueden existir muchos lugares con tráfico y que no son detectados, pues la cobertura de los sensores, no abarca todos los posibles lugares de congestión vehicular.</p>
				<p>Uno de los puntos centrales de la aplicación en la cual se utilizarán las herramientas estudiadas, es el poder presentar en tiempo real el tráfico en la ciudad. Para esto es necesario captar los tuits indicativos de tráfico, la recopilación en una base de datos y la presentación gráfica de los puntos donde existe congestión.</p>
				<p>De la información obtenida por la municipalidad de Quito, actualmente los sensores generan información, que es utilizada bajo demanda para analizar situaciones de congestión vehicular. Hoy en día esta entidad no dispone de una aplicación que le permita observar en tiempo real el tráfico en la ciudad, además que la misma solo hace referencia a los sectores en los cuales están instalados los sensores, lo cual no permite analizar todos los sectores que registran tráfico vehicular, en la localidad.</p>
			</sec>
			<sec>
				<title>6.2. Información recolectada de la red social Twitter</title>
				<p>La aplicación creada permite, a través de los tuits; disponer de información inmediata del tráfico, presentando los lugares donde al momento las personas indica que existe tráfico vehicular, con una actualización cada 5 minutos. Sin embargo, la alerta de tráfico se mantiene por un período de 30 minutos, lo cual permite observar de mejor manera el tráfico en la ciudad. </p>
				<p>Para observar y verificar los resultados, se realizó un estudio inicial por un período de 3 meses, incluyendo los meses de mayo, abril y junio en los que se obtuvo información que sirve para validar la investigación realizada, contrastándola con la generada por los sensores existentes en la urbe. </p>
				<p>En la figura presentada por el sistema puede observarse parte de la ciudad de Quito, donde se ha generado congestión vehicular. Se puede evidenciar también la existencia de lugares donde existe tráfico vehicular, de acuerdo a lo indicado por la población.</p>
				<p>Comparando esta información con la presentada por los puntos informados a través de los sensores, se verifica por una parte la eficacia del sistema y por otra la falta de eficacia para determinar todos los puntos de tráfico con los sensores del municipio.</p>
				<p>Al observar los datos generales de tráfico en la ciudad de Quito, señalados en la <xref ref-type="fig" rid="f9">Fig. 9</xref>, establecidos a través de tuits, se puede observar que en la parte urbana existe a lo largo del día acumulación en diversos puntos, existiendo mayormente a nivel de sector centro norte puntos de congestión vehicular.</p>
				<p>
					<fig id="f9">
						<label>Figura 9</label>
						<caption>
							<title>Localización geográfica de los tuits recopilados sobre un mapa de Quito</title>
						</caption>
						<graphic xlink:href="0012-7353-dyna-85-205-00363-gf9.png"/>
						<attrib><bold>Fuente.</bold> Los autores</attrib>
					</fig>
				</p>
				<p>Con esta información se puede observar puntos de congestión, tanto con la información de los sensores, como de los tuits, mediante la interfaz gráfica de la aplicación. Para esto se utilizó la API de Google Mapas.</p>
			</sec>
		</sec>
		<sec sec-type="conclusions">
			<title>7. Conclusiones y trabajos futuros</title>
			<p>La investigación ha permitido determinar, por una parte, la necesidad de la ciudad de Quito por contar con herramientas que permitan la toma de decisiones para mejorar la congestión vehicular. </p>
			<p>Las herramientas de sustento y recopilación de la información analizada y considerada, han permitido la creación de una aplicación que permite medir la congestión vehicular. Para lo cual, se hace uso de los sensores existentes en la ciudad, pero principalmente mediante la data proporcionada por la red social Twitter, misma que ha sido recopilada para su procesamiento.</p>
			<p>Los datos proporcionados por los tuits mostraron, en la mayoría de casos, mayor cobertura que los que presentan los sensores colocados a lo largo de la ciudad.</p>
			<p>Se debe considerar como una opción viable y de menor costo el uso de la aplicación desarrollada, que toma los datos obtenidos de los tuits, para la toma de decisiones sobre congestión vehicular.</p>
			<p>Se verifica la importancia y potencialidad de la aplicación, para que la misma sea utilizada como: ente emisor de alertas a los conductores, en la eficiencia y control del transporte público, entre otras, en beneficio de la ciudad de Quito.</p>
			<p>Existe un sesgo en la investigación realizada, pues la misma se centra solamente en ciertos lugares de la ciudad en donde existen sensores, lo cual genera resultados parciales. Frente a esto, se recomienda considerar la implementación de sistemas de bajo costo (Arduino) [<xref ref-type="bibr" rid="B21">21</xref>], mediante la instalación de una constelación de sensores, en el resto de lugares de la ciudad.</p>
			<p>La investigación realizada tiene una limitante importante, que está relacionada con la necesidad de que las cuentas de Twitter utilizadas deben tener activada la opción de geolocalización.</p>
			<p>Una importante utilidad, que no forma parte del alcance de la presente investigación, hace referencia a poder retuitar los mensajes, informando rutas alternativas en caso de que las principales estén congestionadas.</p>
			<p>Se limita la utilización del hashtag #TraficoUIO con la comunidad universitaria UTE.</p>
			<p>Como trabajo futuro, se debe considerar mostrar gráficamente el tráfico desde el nivel Débil hasta el nivel Medio, y poder ejecutar acciones que prevengan situaciones de congestión vehicular.</p>
			<p>Para comprobar que el sistema de sistema de información propuesto posibilita detectar situaciones de congestión vehicular en la ciudad de Quito. Se utiliza para el análisis estadístico el coeficiente de Pearson; que correlaciona el indicador de congestión vehicular de los sensores y el detectado por los mensajes de la red social Twitter.</p>
		</sec>
	</body>
	<back>
		<ref-list>
			<title>Referencias</title>
			<ref id="B1">
				<label>[1]</label>
				<mixed-citation>[1]  INEC, Proyecciones de la población Ecuatoriana según Cantón, Cifras y estadisticas. [En línea]. [Consultado: 01-01-2015]. Disponible en: <comment>Disponible en: <ext-link ext-link-type="uri" xlink:href="http://www.ecuadorencifras.gob.ec/documentos/web-inec/Poblacion_y_Demografia/Proyecciones_Poblacionales/proyeccion_cantonal_total_2010-2020.xlsx">http://www.ecuadorencifras.gob.ec/documentos/web-inec/Poblacion_y_Demografia/Proyecciones_Poblacionales/proyeccion_cantonal_total_2010-2020.xlsx</ext-link>
					</comment>. [Último acceso: 10 12 2017].</mixed-citation>
				<element-citation publication-type="webpage">
					<person-group person-group-type="author">
						<collab>INEC</collab>
					</person-group>
					<source>Proyecciones de la población Ecuatoriana según Cantón, Cifras y estadisticas</source>
					<date-in-citation content-type="access-date" iso-8601-date="2015-01-01">01-01-2015</date-in-citation>
					<comment>Disponible en: <ext-link ext-link-type="uri" xlink:href="http://www.ecuadorencifras.gob.ec/documentos/web-inec/Poblacion_y_Demografia/Proyecciones_Poblacionales/proyeccion_cantonal_total_2010-2020.xlsx">http://www.ecuadorencifras.gob.ec/documentos/web-inec/Poblacion_y_Demografia/Proyecciones_Poblacionales/proyeccion_cantonal_total_2010-2020.xlsx</ext-link>
					</comment>
				</element-citation>
			</ref>
			<ref id="B2">
				<label>[2]</label>
				<mixed-citation>[2]  Alcaldía de Quito, Noticias, Distritro Metropolitano de Quito. [En línea]. [Consultado: 01-01-2011]. Disponible en: <comment>Disponible en: <ext-link ext-link-type="uri" xlink:href="http://www.diariocritico.com/noticia/155769/noticias/la-congestion-vehicular-sigue-sin-solucion-en-quito.html">http://www.diariocritico.com/noticia/155769/noticias/la-congestion-vehicular-sigue-sin-solucion-en-quito.html</ext-link>
					</comment>.. [Último acceso: 15 10 2015].</mixed-citation>
				<element-citation publication-type="newspaper">
					<person-group person-group-type="author">
						<collab>Alcaldía de Quito</collab>
					</person-group>
					<source>Noticias, Distritro Metropolitano de Quito</source>
					<date-in-citation content-type="access-date" iso-8601-date="2011-01-01">01-01-2011</date-in-citation>
					<comment>Disponible en: <ext-link ext-link-type="uri" xlink:href="http://www.diariocritico.com/noticia/155769/noticias/la-congestion-vehicular-sigue-sin-solucion-en-quito.html">http://www.diariocritico.com/noticia/155769/noticias/la-congestion-vehicular-sigue-sin-solucion-en-quito.html</ext-link>
					</comment>
				</element-citation>
			</ref>
			<ref id="B3">
				<label>[3]</label>
				<mixed-citation>[3]  Pinto, G., Hacia una movilidad inteligente en la ciudad de Quito, pp. 20-25, 2013. </mixed-citation>
				<element-citation publication-type="book">
					<person-group person-group-type="author">
						<name>
							<surname>Pinto</surname>
							<given-names>G.</given-names>
						</name>
					</person-group>
					<source>Hacia una movilidad inteligente en la ciudad de Quito</source>
					<fpage>20</fpage>
					<lpage>25</lpage>
					<year>2013</year>
				</element-citation>
			</ref>
			<ref id="B4">
				<label>[4]</label>
				<mixed-citation>[4]  Herrera, N.H. and Santamaria, H.S., Analysis of the factors generating vehicular traffic, de ICEDEG Conference on eDemocracy &amp; eGovernment, Quito, 2016. </mixed-citation>
				<element-citation publication-type="confproc">
					<person-group person-group-type="author">
						<name>
							<surname>Herrera</surname>
							<given-names>N.H.</given-names>
						</name>
					</person-group>
					<person-group person-group-type="author">
						<name>
							<surname>Santamaria</surname>
							<given-names>H.S.</given-names>
						</name>
					</person-group>
					<source>Analysis of the factors generating vehicular traffic</source>
					<conf-name>ICEDEG Conference on eDemocracy &amp; eGovernment</conf-name>
					<conf-loc>Quito</conf-loc>
					<conf-date>2016</conf-date>
				</element-citation>
			</ref>
			<ref id="B5">
				<label>[5]</label>
				<mixed-citation>[5]  Zikopoulos, C.E.P., Understanding Big Data: analytics for enterprise class hadoop and streaming data, Chicago: McGraw-Hill Osborne Media, 2011. </mixed-citation>
				<element-citation publication-type="book">
					<person-group person-group-type="author">
						<name>
							<surname>Zikopoulos</surname>
							<given-names>C.E.P.</given-names>
						</name>
					</person-group>
					<source>Understanding Big Data: analytics for enterprise class hadoop and streaming data</source>
					<publisher-loc>Chicago</publisher-loc>
					<publisher-name>McGraw-Hill Osborne Media</publisher-name>
					<year>2011</year>
				</element-citation>
			</ref>
			<ref id="B6">
				<label>[6]</label>
				<mixed-citation>[6]  Aguilar, L.J., Big Data análisis de grandes volúmenes de datos en organizaciones, México: Alfaomega Grupo Editor, S.A, 2013. </mixed-citation>
				<element-citation publication-type="book">
					<person-group person-group-type="author">
						<name>
							<surname>Aguilar</surname>
							<given-names>L.J.</given-names>
						</name>
					</person-group>
					<source>Big Data análisis de grandes volúmenes de datos en organizaciones</source>
					<publisher-loc>México</publisher-loc>
					<publisher-name>Alfaomega Grupo Editor, S.A</publisher-name>
					<year>2013</year>
				</element-citation>
			</ref>
			<ref id="B7">
				<label>[7]</label>
				<mixed-citation>[7]  Delgado, P.S.M.V.J., CBI Ciencias básicas e ingeniería,. [En línea]. [Consultado: 7-12-2011]. Disponible en: <comment>Disponible en: <ext-link ext-link-type="uri" xlink:href="http://sgpwe.izt.uam.mx/pages/cbi/psb/vfinal.pdf">http://sgpwe.izt.uam.mx/pages/cbi/psb/vfinal.pdf</ext-link>
					</comment>. [Último acceso: 08 03 2018].</mixed-citation>
				<element-citation publication-type="webpage">
					<person-group person-group-type="author">
						<name>
							<surname>Delgado</surname>
							<given-names>P.S.M.V.J.</given-names>
						</name>
					</person-group>
					<source>CBI Ciencias básicas e ingeniería</source>
					<date-in-citation content-type="access-date" iso-8601-date="2015-12-07">7-12-2011</date-in-citation>
					<comment>Disponible en: <ext-link ext-link-type="uri" xlink:href="http://sgpwe.izt.uam.mx/pages/cbi/psb/vfinal.pdf">http://sgpwe.izt.uam.mx/pages/cbi/psb/vfinal.pdf</ext-link>
					</comment>
				</element-citation>
			</ref>
			<ref id="B8">
				<label>[8]</label>
				<mixed-citation>[8]  Kwak, D., Liu, R., Kim, D., Nath, B. and Iftode, L., Seeing is believing: sharing real-time visual traffic information via vehicular clouds, IEEE Access, 4(12), pp. 3617-3631, 2016. DOI: 10.1109/ACCESS.2016.2569585</mixed-citation>
				<element-citation publication-type="journal">
					<person-group person-group-type="author">
						<name>
							<surname>Kwak</surname>
							<given-names>D.</given-names>
						</name>
						<name>
							<surname>Liu</surname>
							<given-names>R.</given-names>
						</name>
						<name>
							<surname>Kim</surname>
							<given-names>D.</given-names>
						</name>
						<name>
							<surname>Nath</surname>
							<given-names>B.</given-names>
						</name>
						<name>
							<surname>Iftode</surname>
							<given-names>L.</given-names>
						</name>
					</person-group>
					<article-title>Seeing is believing: sharing real-time visual traffic information via vehicular clouds</article-title>
					<source>IEEE Access</source>
					<volume>4</volume>
					<issue>12</issue>
					<fpage>3617</fpage>
					<lpage>3631</lpage>
					<year>2016</year>
					<pub-id pub-id-type="doi">10.1109/ACCESS.2016.2569585</pub-id>
				</element-citation>
			</ref>
			<ref id="B9">
				<label>[9]</label>
				<mixed-citation>[9]  Cárdenas-Benítez, N., Aquino-Santos, R., Magaña-Espinoza, P., Aguilar-Velazco, J., Edwards-Block, A. and Medina-Cass, A., Traffic congestion detection system through connected vehicles and Big Data, Sensors, 16(5), p. 599, 2016. DOI: 10.3390/s16050599</mixed-citation>
				<element-citation publication-type="journal">
					<person-group person-group-type="author">
						<name>
							<surname>Cárdenas-Benítez</surname>
							<given-names>N.</given-names>
						</name>
						<name>
							<surname>Aquino-Santos</surname>
							<given-names>R.</given-names>
						</name>
						<name>
							<surname>Magaña-Espinoza</surname>
							<given-names>P.</given-names>
						</name>
						<name>
							<surname>Aguilar-Velazco</surname>
							<given-names>J.</given-names>
						</name>
						<name>
							<surname>Edwards-Block</surname>
							<given-names>A.</given-names>
						</name>
						<name>
							<surname>Medina-Cass</surname>
							<given-names>A.</given-names>
						</name>
					</person-group>
					<article-title>Traffic congestion detection system through connected vehicles and Big Data</article-title>
					<source>Sensors</source>
					<volume>16</volume>
					<issue>5</issue>
					<fpage>599</fpage>
					<lpage>599</lpage>
					<year>2016</year>
					<pub-id pub-id-type="doi">10.3390/s16050599</pub-id>
				</element-citation>
			</ref>
			<ref id="B10">
				<label>[10]</label>
				<mixed-citation>[10]  Tostes-Ribeiro, A., Henrique-Silva, T., Duarte-Figueiredo, F. and Loureiro, A.A.F., Studying traffic conditions by analyzing foursquare and instagram data, in: Symposium on performance evaluation of wireless ad hoc, sensor, &amp; ubiquitous networks, Canada, 2014. </mixed-citation>
				<element-citation publication-type="confproc">
					<person-group person-group-type="author">
						<name>
							<surname>Tostes-Ribeiro</surname>
							<given-names>A.</given-names>
						</name>
						<name>
							<surname>Henrique-Silva</surname>
							<given-names>T.</given-names>
						</name>
						<name>
							<surname>Duarte-Figueiredo</surname>
							<given-names>F.</given-names>
						</name>
						<name>
							<surname>Loureiro</surname>
							<given-names>A.A.F.</given-names>
						</name>
					</person-group>
					<source>Studying traffic conditions by analyzing foursquare and instagram data</source>
					<conf-name>Symposium on performance evaluation of wireless ad hoc, sensor, &amp; ubiquitous networks</conf-name>
					<conf-loc>Canada</conf-loc>
					<conf-date>2014</conf-date>
				</element-citation>
			</ref>
			<ref id="B11">
				<label>[11]</label>
				<mixed-citation>[11]  D'Andrea, E., Ducange, P., Lazzerini, B. and Marcelloni, F., Real-Time Detection of Traffic From Twitter Stream Analysis, IEEE Transactions on Intelligent Transportation Systems, 16(4), pp. 2269-2283, 2015. DOI: 10.1109/TITS.2015.2404431</mixed-citation>
				<element-citation publication-type="journal">
					<person-group person-group-type="author">
						<name>
							<surname>D'Andrea</surname>
							<given-names>E.</given-names>
						</name>
						<name>
							<surname>Ducange</surname>
							<given-names>P.</given-names>
						</name>
						<name>
							<surname>Lazzerini</surname>
							<given-names>B.</given-names>
						</name>
						<name>
							<surname>Marcelloni</surname>
							<given-names>F.</given-names>
						</name>
					</person-group>
					<article-title>Real-Time Detection of Traffic From Twitter Stream Analysis</article-title>
					<source>IEEE Transactions on Intelligent Transportation Systems</source>
					<volume>16</volume>
					<issue>4</issue>
					<fpage>2269</fpage>
					<lpage>2283</lpage>
					<year>2015</year>
					<pub-id pub-id-type="doi">10.1109/TITS.2015.2404431</pub-id>
				</element-citation>
			</ref>
			<ref id="B12">
				<label>[12]</label>
				<mixed-citation>[12]  Nellore, K. and Hancke, G.P., A survey on urban traffic management system using wireless sensor networks, Sensors, 16(2), p. 157, 2016. DOI: 10.3390/s16020157</mixed-citation>
				<element-citation publication-type="journal">
					<person-group person-group-type="author">
						<name>
							<surname>Nellore</surname>
							<given-names>K.</given-names>
						</name>
						<name>
							<surname>Hancke</surname>
							<given-names>G.P.</given-names>
						</name>
					</person-group>
					<article-title>A survey on urban traffic management system using wireless sensor networks</article-title>
					<source>Sensors</source>
					<volume>16</volume>
					<issue>2</issue>
					<fpage>157</fpage>
					<lpage>157</lpage>
					<year>2016</year>
					<pub-id pub-id-type="doi">10.3390/s16020157</pub-id>
				</element-citation>
			</ref>
			<ref id="B13">
				<label>[13]</label>
				<mixed-citation>[13]  García, F.C., Umap, inteligencia colectiva extraída de las redes sociales, Profit, Barcelona-España, 2010.</mixed-citation>
				<element-citation publication-type="book">
					<person-group person-group-type="author">
						<name>
							<surname>García</surname>
							<given-names>F.C.</given-names>
						</name>
					</person-group>
					<source>Umap, inteligencia colectiva extraída de las redes sociales</source>
					<publisher-name>Profit</publisher-name>
					<publisher-loc>Barcelona-España</publisher-loc>
					<year>2010</year>
				</element-citation>
			</ref>
			<ref id="B14">
				<label>[14]</label>
				<mixed-citation>[14]  Reyes-Zambrano, G. and Hidalgo-Veliz, R.N., Vehicular swept path analysis using K-means algorithm, International Journal of Applied Engineering Research, 11(18), pp. 9536-9538, 2016. </mixed-citation>
				<element-citation publication-type="journal">
					<person-group person-group-type="author">
						<name>
							<surname>Reyes-Zambrano</surname>
							<given-names>G.</given-names>
						</name>
						<name>
							<surname>Hidalgo-Veliz</surname>
							<given-names>R.N.</given-names>
						</name>
					</person-group>
					<article-title>Vehicular swept path analysis using K-means algorithm</article-title>
					<source>International Journal of Applied Engineering Research</source>
					<volume>11</volume>
					<issue>18</issue>
					<fpage>9536</fpage>
					<lpage>9538</lpage>
					<year>2016</year>
				</element-citation>
			</ref>
			<ref id="B15">
				<label>[15]</label>
				<mixed-citation>[15]  Villena-Román, J., Luna-Cobos, A. y González-Cristóbal, J.C., Análisis semántico de la opinión de los ciudadanos, SEPLEN, 53, pp. 59-162, 2014. </mixed-citation>
				<element-citation publication-type="journal">
					<person-group person-group-type="author">
						<name>
							<surname>Villena-Román</surname>
							<given-names>J.</given-names>
						</name>
						<name>
							<surname>Luna-Cobos</surname>
							<given-names>A.</given-names>
						</name>
						<name>
							<surname>González-Cristóbal</surname>
							<given-names>J.C.</given-names>
						</name>
					</person-group>
					<article-title>Análisis semántico de la opinión de los ciudadanos</article-title>
					<source>SEPLEN</source>
					<issue>53</issue>
					<fpage>59</fpage>
					<lpage>162</lpage>
					<year>2014</year>
				</element-citation>
			</ref>
			<ref id="B16">
				<label>[16]</label>
				<mixed-citation>[16]  Universidad Distrital Francisco José de Caldas, Metodología de análisis estadistico de la información [En línea]. [Consultado: 08-03-2018]. Disponible en: <comment>Disponible en: <ext-link ext-link-type="uri" xlink:href="http://repository.udistrital.edu.co/bitstream/11349/3815/3/ParraRinconDanielaAlejandraAnexo-3.pdf">http://repository.udistrital.edu.co/bitstream/11349/3815/3/ParraRinconDanielaAlejandraAnexo-3.pdf</ext-link>
					</comment>.</mixed-citation>
				<element-citation publication-type="webpage">
					<person-group person-group-type="author">
						<collab>Universidad Distrital Francisco José de Caldas</collab>
					</person-group>
					<source>Metodología de análisis estadistico de la información</source>
					<date-in-citation content-type="access-date" iso-8601-date="2018-03-08">08-03-2018</date-in-citation>
					<comment>Disponible en: <ext-link ext-link-type="uri" xlink:href="http://repository.udistrital.edu.co/bitstream/11349/3815/3/ParraRinconDanielaAlejandraAnexo-3.pdf">http://repository.udistrital.edu.co/bitstream/11349/3815/3/ParraRinconDanielaAlejandraAnexo-3.pdf</ext-link>
					</comment>
				</element-citation>
			</ref>
			<ref id="B17">
				<label>[17]</label>
				<mixed-citation>[17]  Herramientas para Big Data: Entorno Hadoop., 2014.</mixed-citation>
				<element-citation publication-type="book">
					<source>Herramientas para Big Data: Entorno Hadoop</source>
					<year>2014</year>
				</element-citation>
			</ref>
			<ref id="B18">
				<label>[18]</label>
				<mixed-citation>[18]  Time Outsourcing Center, Introducción a Hadoop y su ecosistema, 2015. [En línea]. Disponible en: <ext-link ext-link-type="uri" xlink:href="http://www.ticout.com/blog/2013/04/02/introduccion-a-hadoop-y-su-ecosistema/">http://www.ticout.com/blog/2013/04/02/introduccion-a-hadoop-y-su-ecosistema/</ext-link>.</mixed-citation>
				<element-citation publication-type="book">
					<person-group person-group-type="author">
						<collab>Time Outsourcing Center</collab>
					</person-group>
					<source>Introducción a Hadoop y su ecosistema</source>
					<year>2015</year>
					<ext-link ext-link-type="uri" xlink:href="http://www.ticout.com/blog/2013/04/02/introduccion-a-hadoop-y-su-ecosistema/">http://www.ticout.com/blog/2013/04/02/introduccion-a-hadoop-y-su-ecosistema/</ext-link>
				</element-citation>
			</ref>
			<ref id="B19">
				<label>[19]</label>
				<mixed-citation>[19]  Pérez, B.G., TDC (Twitter Data Collection): creación de una gran base de datos de Tweets., Universidad Autónoma de Madrid, Madrid, España, 2014.</mixed-citation>
				<element-citation publication-type="book">
					<person-group person-group-type="author">
						<name>
							<surname>Pérez</surname>
							<given-names>B.G.</given-names>
						</name>
					</person-group>
					<source>TDC (Twitter Data Collection): creación de una gran base de datos de Tweets</source>
					<publisher-name>Universidad Autónoma de Madrid</publisher-name>
					<publisher-loc>Madrid</publisher-loc>
					<year>2014</year>
				</element-citation>
			</ref>
			<ref id="B20">
				<label>[20]</label>
				<mixed-citation>[20]  Schmarzo, B., Big data, el poder de los datos, Estados Unidos: Anaya Multimedia-Anaya Interactiva, 2014. </mixed-citation>
				<element-citation publication-type="book">
					<person-group person-group-type="author">
						<name>
							<surname>Schmarzo</surname>
							<given-names>B.</given-names>
						</name>
					</person-group>
					<source>Big data, el poder de los datos</source>
					<publisher-loc>Estados Unidos</publisher-loc>
					<publisher-name>Anaya Multimedia-Anaya Interactiva</publisher-name>
					<year>2014</year>
				</element-citation>
			</ref>
			<ref id="B21">
				<label>[21]</label>
				<mixed-citation>[21]  Faludi, R., Building Wireless sensor networks, United States of America: O' Reilly Media, 2011.</mixed-citation>
				<element-citation publication-type="book">
					<person-group person-group-type="author">
						<name>
							<surname>Faludi</surname>
							<given-names>R.</given-names>
						</name>
					</person-group>
					<source>Building Wireless sensor networks</source>
					<publisher-loc>United States of America</publisher-loc>
					<publisher-name>O' Reilly Media</publisher-name>
					<year>2011</year>
				</element-citation>
			</ref>
		</ref-list>
		<fn-group>
			<fn fn-type="other" id="fn0">
				<label>How to cite:</label>
				<p> Herrera-Herrera, N.I., Luján-Mora, S. and Gómez-Torres, E.R., Integración de herramientas para la toma de decisiones en la congestión vehicular DYNA, 85(205), pp. 363-370, June, 2018.</p>
			</fn>
		</fn-group>
		<fn-group>
			<fn fn-type="other" id="fn2">
				<label>2</label>
				<p>La etiqueta o hashtag tiene como objetivo agrupar tuits que hablen de un mismo tema y facilitar la búsqueda de información</p>
			</fn>
		</fn-group>
		<fn-group>
			<fn fn-type="other" id="fn3">
				<label>3</label>
				<p>El tipo de instalación realizada es Single Node</p>
			</fn>
		</fn-group>
		<fn-group>
			<fn fn-type="other" id="fn4">
				<label>4</label>
				<p>La versión de utilizada es apache-flume-1.6.0</p>
			</fn>
		</fn-group>
	</back>
</article>