LOS MODELOS DE DIÁLOGO Y SUS APLICACIONES EN SISTEMAS DE DIÁLOGO HOMBRE-MÁQUINA: REVISIÓN DE LA LITERATURA
Keywords:
modelo de diálogo, sistema de diálogo, gestor de diálogo, actos del habla, expresiones. (es)Downloads
LOS MODELOS DE DIÁLOGO Y SUS APLICACIONES EN SISTEMAS DE DIÁLOGO HOMBRE-MÁQUINA: REVISIÓN DE LA LITERATURA
DIALOG MODELS AND THEIR APPLICATIONS IN HUMAN-COMPUTER DIALOG SYSTEMS: STATE-OF-THE-ART REVIEW
CARLOS
M. ZAPATA
Grupo de
Investigación en Lenguajes Computacionales, Universidad Nacional de
Colombia, Medellín, cmzapata@unal.edu.co
JHON E.
MESA
Grupo de Investigación en
Lenguajes Computacionales, Universidad
Nacional de Colombia, Medellín, jemesa@unal.edu.co
Recibido para revisar enero 21 de 2008, aceptado junio 18 de 2008, versión final junio 26 de 2008
RESUMEN: Un proceso de diálogo entre humanos involucra una serie de actos del habla, cuya finalidad es transmitir los deseos, intenciones y creencias entre las partes involucradas en el mismo. El reconocimiento y clasificación de los actos del habla, la construcción de modelos basados en estos actos del habla y la evaluación de los modelos construidos, es el objetivo de los modelos de diálogo. Además, estos modelos, incorporados en un sistema informático, permiten la interacción hombre-máquina usando el habla para la solución de diversos problemas cotidianos como: comprar un tiquete de tren, reservar un vuelo, etc. En este artículo se recogen las diferentes técnicas para la construcción de modelos de diálogo y algunos de los diversos sistemas informáticos que surgieron a partir de ellos, con el fin de determinar la aplicabilidad de los modelos de diálogo en el proceso de captura de requisitos durante la fase de definición del ciclo de vida de una aplicación de software.
PALABRAS CLAVE: modelo de diálogo, sistema de diálogo, gestor de diálogo, actos del habla, expresiones.
ABSTRACT: Speech acts are involved by human-human dialog processes. The purpose of speech acts is to transmit the desires, intentions, and beliefs among dialogue participants. In addition to speech acts, dialog models are suitable to recognize and classify speech acts, to make and evaluate speech-act-based dialog models. Dialog models, incorporated in a computer system, allow human-computer interaction and they can be used to solve, by means of the use of speech, several day-to-day problems like buying a train ticket, reserving a fight ticket, etc. We collect, in this paper, several techniques to make dialog models and some of the diverse computer systems that have been built from them. We are interested in determining the applicability of dialog models in the requirements capturing process, which belongs to the definition stage of software development lifecycle.
KEY WORDS: dialog model, system dialog, dialog manager, speech acts, utterances.
1. INTRODUCCIÓN
Un diálogo es una conversación entre dos o más personas, llamadas interlocutores, que alternativamente (haciendo uso de turnos) manifiestan sus deseos, intenciones y creencias, mientras hacen parte de un proceso de negociación [1-2].
En un diálogo cualquiera, la forma en que los interlocutores comunican sus deseos, intenciones y creencias se caracteriza mediante el uso de los actos del habla, los cuales se clasifican en: afirmaciones, preguntas, directrices, respuestas, promesas y declaraciones, entre otras [3].
Cada acto del habla tiene sus propias características y formas de aparición en un diálogo. Además, cada acto del habla se compone de unidades fundamentales más pequeñas denominadas en inglés utterance. Un utterance es toda producción de sonido limitada por respiros o pausas [4]. Las técnicas para la construcción de modelos de diálogo se basan en esta medida fundamental, para modelar los diferentes diálogos que pueden desarrollar los humanos [5-6].
Los modelos de diálogo son esquemas que tratan de clasificar y caracterizar los diferentes actos del habla, que se pueden encontrar en un diálogo, y determinar las posibles interrelaciones que poseen [7].
Para la elaboración de un modelo de diálogo, es necesario contar con un dominio de interacción y los conceptos susceptibles de referenciar en dicho dominio, incluyendo sus relaciones. Estos conceptos, y su dominio de interacción, se conocen como la ontología del dominio de interacción del modelo de diálogo [8].
La ontología necesaria para la elaboración de un modelo de diálogo se determina a partir de la recolección de numerosos diálogos que las personas llevan a cabo, según el dominio de interacción. Este conjunto de diálogos, se conoce como corpus hablado y sirve como insumo inicial para la creación del modelo de diálogo, usando diversas técnicas como diagramas estocásticos, máquinas de estados, etc. [9].
La construcción de los modelos de diálogo tiene como fin el desarrollo de sistemas de diálogo, que son capaces de interactuar con interlocutores humanos por medio del habla [10].
Son varias las propuestas para la construcción de sistemas de diálogo pero, en general, todas estas propuestas coinciden en que un sistema tal debe tener: un mecanismo de entrada del diálogo del usuario, un analizador sintáctico y semántico que examine y caracterice dichas entradas, un gestor de diálogo que administre el diálogo con el usuario y determine las acciones más adecuadas a desarrollar de acuerdo con las entradas, el corpus hablado del sistema y un generador de diálogo que origine la respuesta al usuario [11].
Dependiendo de cómo se construya el sistema de diálogo, las características del modelo de diálogo y la forma en que se administre, los sistemas de diálogo se clasifican en:
- Basados en pregunta-respuesta, que se caracterizan porque sólo el sistema tiene la facultad de dirigir el diálogo y la interacción se basa únicamente en una pregunta realizada por el usuario y una respuesta generada por el sistema [12], o a la inversa.
- Intencionales, en los cuales todos los interlocutores (usuarios y sistema) tienen la facultad de guiar el diálogo. Además, puede existir un intercambio bidireccional de información entre ellos con la intención de alcanzar unas metas [8].
Además de la construcción del sistema de diálogo con su respectivo modelo de diálogo, también, es necesario contar con métricas que permitan evaluar la eficiencia y tasa de acierto del sistema. En este aspecto, existen varias propuestas desarrolladas desde la estadística que ayudan a este propósito [13].
En este artículo se muestran las técnicas existentes para la elaboración, construcción y administración de modelos de diálogo y algunos de los diversos sistemas informáticos construidos con estas técnicas y otras tecnologías de procesamiento del lenguaje natural tales como: tratamiento del habla, sintetizadores del habla, analizadores sintácticos y semánticos, etc. Esto se hace con el fin de determinar la aplicabilidad de estos modelos y sistemas en el proceso de captura de requisitos durante la fase de definición del ciclo de vida de una aplicación de software.
El artículo se organiza así: en la sección 2, se discuten algunas técnicas existentes para la construcción, administración, y evaluación de modelos de diálogo; en la sección 3, se describen diversos sistemas de diálogo que utilizan los modelos de diálogo para interactuar con sus usuarios por medio del habla; en la sección 4, se discute la aplicabilidad de este tipo de modelos y sistemas a la captura de requisitos de software. Finalmente, las conclusiones y el trabajo futuro se discuten en las secciones 5 y 6, respectivamente.
2. TÉCNICAS PARA LA CONSTRUCCIÓN, ADMINISTRACIÓN Y EVALUACIÓN DE MODELOS DE DIÁLOGO
Las técnicas para la construcción de modelos de diálogo, que se presentan a continuación, se basan en la identificación y clasificación de los actos del habla y en la forma en que se pueden encontrar en un diálogo cualquiera.
Grosz y Sidner [14] presentan los elementos básicos de una teoría computacional para el tratamiento de la estructura del discurso. Con el modelo, se trata de responder a dos preguntas que surgen en un discurso: ¿qué origina un discurso? y ¿qué lo hace coherente? Para ello, se toman en consideración las dos características de un discurso: intención y atención [14].
La estructura de cualquier discurso consta de tres componentes: la estructura de la secuencia de las unidades del habla (representadas por el vocablo inglés Utterance [4]), la estructura de las intenciones y el estado de atención. Con estos tres componentes, es posible determinar los actos del habla de un discurso cualquiera y las diferentes relaciones que puedan poseer [14].
Aunque el enfoque de Grosz y Sidner [14] es el análisis de discursos, el modelo que ellos proponen se puede aplicar a diálogos orientados a la tarea (diálogos en donde uno de los interlocutores busca que los otros participantes realicen alguna acción) haciendo algunas suposiciones en su modelo [14-17].
Por otro lado, Zubizarreta [2] propone, en el proceso de caracterización del diálogo, el empleo de funciones que usan los constituyentes del diálogo (interlocutores), denominadas funciones ilocutivas, que son funciones que cambian la relación entre los participantes del diálogo [18]. Estas funciones se asocian con cada acto del habla y su uso puede requerir que se cumplan condiciones (precondiciones o poscondiciones) al interior del diálogo [2]. El uso de estas funciones en un diálogo orientado a la tarea facilita la elaboración del árbol estructural de tales funciones, utilizando una gramática léxico-funcional [19]. La elaboración de este árbol facilita la interpretación del diálogo y sirve para determinar la mejor manera de responder a una solicitud particular emanada de cualquier interlocutor [2].
Igualmente, Really [20] presenta una descripción del diálogo, dividida en dos partes fundamentales: un análisis sintáctico de la estructura del diálogo y una descripción del contexto comunicativo. Las unidades básicas de esta descripción son: expresiones de significado (ME), acto comunicativo (CAct), situación comunicativa (CS) y estructura de la situación comunicativa (CSS). Con el uso de las unidades básicas, es posible elaborar la relación estructural del diálogo que se esté tratando, identificando todas las relaciones jerárquicas que puedan existir entre estas unidades básicas [20].
Otros trabajos similares, que buscan caracterizar el diálogo, son los de: Grice [21], Austin [22], Searle [23] y Sperber y Wilson [24].
Los trabajos de Grosz y Sidner [14], Zubizarreta [2] y Really [20] se basan únicamente en la caracterización del diálogo, pero no proponen la forma de etiquetar en un corpus hablado los actos del habla, ni la representación del modelo de diálogo según estas etiquetas, ni el mecanismo para gestionar un diálogo cualquiera.
En la etiquetación de los actos del habla, Martínez et al. [25] proponen un conjunto de etiquetas para los actos del habla de tres niveles.
El primer nivel de etiquetación es independiente del dominio del diálogo y describe el comportamiento de éste (inicio-diálogo, cierre-diálogo, pregunta, respuesta confirmación, etc.).
El segundo nivel se relaciona con la representación semántica de una frase hablada que realiza un interlocutor en un turno del diálogo. Finalmente, el tercer nivel representa la información proporcionada en un turno del diálogo que hace referencia a la ontología del dominio. A partir de esta clasificación, es posible construir un modelo estocástico, según los actos del habla reconocidos, para representar el modelo de diálogo. Este modelo estocástico, tiene gran utilidad en la elaboración del gestor de diálogo.
En la Figura 1, se encuentra un ejemplo de etiquetación de un diálogo. En esta Figura, INICIO-DIALOGO, PREGUNTA, RESPUESTA, CONFIRMACIÓN Y CIERRE-DIÁLOGO son los actos del habla del diálogo y hacen parte de la etiquetación de primer nivel. VEHICULO-BUS, VEHICULO-MICROBUS, HORA - LLEGADA, HORA - SALIDA y NUEVA-CONSULTA son las representaciones semánticas de cada frase y hacen parte de la etiquetación de segundo nivel. Finalmente, la información proporcionada por el diálogo, como la hora de llegada y salida del bus (cuatro de la tarde, diez de la noche, etc.), compone el tercer nivel de etiquetación.
Figura 1. Ejemplo de etiquetación de un diálogo
Figure 1. Example of a dialog tagging
Además de la propuesta de Martínez et al, [25], existen otras propuestas diferentes para el reconocimiento y etiquetación de los actos del habla, usando redes estocásticas o máquinas de estados. Estas propuestas son la de Fernández et al. [26], Litman et al. [27], Marineau et al. [3], Levin et al. [28], Clark y Popescu [29], Koit [30], Metzing [31], Ji y Bilmes [32], Sent [33] y, Ariav y Calloway [34].
Dentro de la construcción de un sistema de diálogo, es necesario contar con gestor que permita administrar los modelos de diálogo, utilizando su representación en un modelo estocástico. Dentro de las funciones de administración, se encuentran: terminar correctamente un diálogo iniciado, dar cabida a la creación de subdiálogos y permitir la navegación entre los diálogos que cree un interlocutor.
Calle [35] propone, para la gestión del diálogo, un modelo de hilos. Estos hilos se asocian con cada diálogo que un interlocutor inicie y pueden usar, incluso, relaciones de dependencia. El uso de estos hilos permite el tratamiento de subdiálogos que se puedan generar en el transcurso de un diálogo base. Además, el modelo está en capacidad de regresar al diálogo que creó un subdiálogo después que éste finaliza.
Además de la propuesta de Calle [35], existen otros modelos para la gestión del diálogo. Entre estas propuestas destacan la de Morik [36], Yeh et al. [37], Cohen [38], McTear [39] y Litman y Allen [40].
Las anteriores técnicas permiten obtener sistemas de diálogo basados en intenciones, pero poseen una gran limitante: la necesidad de un corpus previo a la elaboración del sistema para construir el modelo estocástico. La exactitud de este sistema depende, en gran parte, del tamaño del corpus recolectado. Ante esta desventaja, existe otro enfoque para la construcción de estos sistemas que no depende del tamaño del corpus, aunque tenga los mismos elementos que los sistemas intencionales tales como: un modelo de diálogo, un gestor de diálogo, etc. Su funcionamiento se basa en traducir las entradas del usuario en consultas SQL (Structured Query Language) por medio de análisis semántico basado en el formalismo lambda calculus [41].
La debilidad de este enfoque, radica en la limitante del sistema de requerir que los interlocutores humanos se entrenen sobre qué preguntas pueden hacer y qué preguntas no pueden hacer, teniendo en cuenta que estas preguntas se deben formular en una expresión formal del lenguaje natural [42].
Sin importar qué sistema de diálogo se desarrolle, ya sea intencional o basado en pregunta-respuesta, es necesario contar con mecanismos que permitan medir su eficiencia. A este respecto, Bernsen et al. [43] proponen el uso de varios indicadores sobre el corpus y el gestor de diálogo para evaluar la eficiencia del sistema. Estos indicadores son, entre otros: número de diálogos finalizados exitosamente, el mismo número, pero incluyendo diálogos con algún fracaso, total de diálogos desarrollados, tiempo promedio de las intervenciones de los interlocutores en cada diálogo, etc. Con estos indicadores, es posible obtener porcentajes que permiten medir la eficiencia y utilidad de un sistema de diálogo en particular.
Además del trabajo de Bernsen et al. [43] existen otras propuestas para medir la eficiencia de un sistema de diálogo como la de: Xu [5], Calle [13], Wai et al. [44] y Kazemzadeh et al. [45].
3. APLICACIÓN DE LOS MODELOS DE DIÁLOGO EN SISTEMAS DE DIÁLOGO HOMBRE-MÁQUINA
Además de las técnicas para la construcción de modelos de diálogo, presentadas en la sección anterior, los avances en las tecnologías del habla y la creciente demanda para acceder a la información por canales amigables (teléfono, web, agendas digitales, etc.), contribuyen al desarrollo de los sistemas de diálogo con gran utilidad en la vida diaria [46]. Estos sistemas cumplen con varias características, tales como: acceso telefónico, dominio semántico restringido e iniciativa mixta en el control del diálogo [47]. Como se estableció en la sección 1, los sistemas de diálogo se dividen en: sistemas pregunta-respuesta [42] [48] y sistemas de diálogos intencionales [14] [8]. Algunos sistemas de diálogo se presentan a continuación.
3.1 Sistemas
pregunta-respuesta
Nandi y Bandyopadhyay
[42], presentan un sistema de diálogo para la gestión de los horarios de los
trenes en la India
en el idioma Telugu. Además de los
componentes de reconocimiento de voz y traducción de sonido en texto, su
componente principal es el manejador de diálogo (DM por sus siglas en inglés)
que es el encargado de administrar el diálogo entre el usuario y el sistema.
También, está en la obligación de transformar la pregunta del usuario en una
sentencia SQL, para luego responder la pregunta en lenguaje natural según el
resultado entregado por la consulta SQL [42]. En
la Figura 2, se encuentra la
arquitectura del sistema pregunta-respuesta.
Figura 2. Arquitectura del sistema
[42]
Figure 2. System Architecture [42]
El sistema, para su funcionamiento, utiliza una base de conocimiento y un corpus de diálogos frecuentes entre los usuarios y empleados del sistema de metro. Con este conocimiento, el sistema es capaz de procesar una pregunta y responder adecuadamente a ésta con una tasa de eficiencia del 96.34% [42]. La debilidad del sistema radica en la necesidad de enseñarle al usuario final qué preguntas puede hacer y qué preguntas no puede hacer; dificultando así una fluidez oral del usuario con el sistema. Esto, hace que el usuario sólo pueda preguntar sobre horarios de trenes y no sobre otros temas que puedan concernir al sistema de trenes en la India [42]. Otros sistemas de diálogo que se basan en el enfoque del sistema anterior, son los de Katz et al. [49], Zheng [50], Qi et al. [51] y Harabagiu et al. [52]. Todos ellos se caracterizan por tratar de responder de la manera más adecuada a preguntas sencillas del interlocutor y esa respuesta no origina una interacción que involucre utterances de un tipo diferente a preguntas de parte del interlocutor y respuestas de parte del sistema.
3.2 Sistemas intencionales
El
sistema HOPS es un proyecto que busca permitir el acceso mediante voz y texto a
los servicios de los ayuntamientos de algunas ciudades de Europa. El sistema se
compone de tres módulos que realizan todo el proceso de diálogo con el sistema: el módulo de voz, el módulo
de texto y el módulo de gestión de diálogo. En
la Figura 3, se encuentra un
esquema de la arquitectura del sistema.
Figura
3. Arquitectura del sistema HOPS [36]
Figure
3. HOPS
system architecture [36]
El módulo de voz se encarga de gestionar la interacción telefónica y de procesar la voz utilizando VoiceXML (un lenguaje estándar para el desarrollo de sistemas de diálogo creado por McGlashan et al. [53]). El módulo de texto gestiona la entrada y salida de texto a través de la web y analiza semántica y sintácticamente la entrada del usuario. El módulo de gestión de diálogo es el encargado de administrar el diálogo entre el usuario y el sistema. Es muy similar al manejador de diálogo descrito en la sección 3.1 pero con la diferencia de que las preguntas no las traduce a consultas SQL, sino que se basa en el formalismo de la semántica lambda calculus para interpretar lo que el usuario pidió. El módulo de gestión de diálogo [42] maneja tanto el módulo de voz como el módulo de texto. En este caso, no se trata sólo de preguntas y respuestas, sino de una verdadera interacción con el sistema de diálogo que permite diferentes tipos de utterances, que el gestor de diálogo controla.
Otros sistemas de diálogo que se basan en el enfoque del sistema anterior, son los de Blaylok y Allen [7], Rodríguez et al. [54], Bonafonte et al. [55] y Pineda et al. [56]. En Blaylok y Allen [7], se permiten utterances diferentes a las preguntas, tales como afirmaciones o confirmaciones, que acercan el diálogo al que se puede dar entre interlocutores humanos. En el caso de Rodríguez et al. [54], se permiten incluso órdenes sencillas en forma de consultas, que posibilitan el manejo de un servidor de correo. En los demás trabajos, también se presenta la posibilidad de ejecutar otras acciones diferentes a la simple interacción entre una pregunta del interlocutor y una respuesta del sistema, mostrando, de esta forma, la intencionalidad que caracteriza a este tipo de sistemas.
4. APLICABILIDAD DE MODELOS Y SISTEMAS DE DIÁLOGO EN LA CAPTURA DE REQUISITOS DE SOFTWARE
El ciclo de vida del software incluye, inicialmente, las fases de definición y análisis, en las cuales se realiza el denominado proceso de educción de requisitos. Este proceso consiste en la captura, recopilación, análisis y transformación de los requisitos que expresan los interesados (aquellos con algún interés en la elaboración de una aplicación de software), en especificaciones formales y semiformales. En [57] se presenta un método automático para la elaboración de diagramas UML (Unified Modeling Language, que se pueden considerar especificaciones semiformales de software), tomando como punto de partida un discurso expresado en el lenguaje controlado UN-Lencep.
El discurso en UN-Lencep se puede elaborar tomando como base dos fuentes diferentes: el estudio exhaustivo de la documentación técnica que suministra el interesado o la aplicación de técnicas de captura de requisitos basadas en diálogos analista-interesado. En esta sección, se discute la segunda opción.
Durante las fases de definición y análisis, correspondientes al desarrollo de una aplicación de software, los diálogos analista-interesado son muy comunes y se suelen ocupar de temas específicos del dominio que hace parte de la futura aplicación, de manera similar a como se produce el diálogo de la Figura 1 para definir los horarios de los buses y microbuses. Sin embargo, en el caso de la educción de requisitos, los diálogos no son tan cortos y se caracterizan por poseer turnos breves del analista (generalmente preguntas abiertas), seguidos por largos turnos de respuesta por parte del interesado. Este tipo de diálogo, es muy difícil de automatizar, puesto que se requiere, para ello, un conjunto robusto de herramientas computacionales para el análisis de la respuesta, que vienen constituyendo durante muchos años el objeto de estudio de la Lingüística Computacional, sin que exista, en la actualidad, una herramienta que realice, de manera completamente automática, este análisis.
Además, los temas que se tratan en estos diálogos son altamente especializados (en la mayoría de los casos), lo cual sugiere la utilización de ontologías y repositorios que, comúnmente, no se encuentran disponibles para su uso. Esto, le resta posibilidades de automatización a dicho diálogo, pues es el analista quien debe intervenir para interpretar la información que le entrega el interesado.
La recopilación de trabajos que se presentó en las secciones 2 y 3, sugiere que es posible la elaboración de un modelo de diálogo enfocado en el proceso de captura de requisitos, el cual sirva de base para la elaboración de un sistema de diálogo, pero también permite intuir algunas dificultades para este proceso:
- No se puede recurrir a ontologías específicas del dominio, pues se restaría generalidad al proceso de desarrollo de software. En este caso, los recursos lingüísticos deberían apuntar a diccionarios computacionales de carácter general.
- Se debería poseer un mecanismo especial que limitara la extensión de las respuestas de los interesados. A este respecto, un lenguaje controlado que permita la definición de plantillas de respuestas podría ser útil.
- Para que el computador lo pueda conducir, el diálogo debería poseer un plan de temas que sirva de guía para “disparar” las preguntas al interesado. En el caso de la captura de requisitos de una aplicación de software, esos temas se podrían identificar hallando las similitudes en varios diálogos reales que tengan esa orientación. Esta limitación sugiere la utilización de modelos y gestores de diálogo de tipo intencional, no limitados únicamente a respuestas sencillas de parte del interesado, puesto que el sistema debe decidir qué tipo de preguntas, afirmaciones o aclaraciones requiere de parte del interesado en cada uno de los instantes del diálogo.
El modelo de diálogo para la captura de requisitos, y el subsecuente sistema de diálogo, pueden conducir a la elaboración automática de discursos en UN-Lencep, que actualmente constituyen el insumo inicial para la generación automática de diagramas de UML.
5. CONCLUSIONES
Un diálogo es un discurso guiado por turnos entre dos o más personas, las cuales buscan, por medio de éste, la satisfacción de unas metas. Los modelos de diálogo tratan de clasificar los actos del habla que se puedan encontrar en un diálogo cualquiera y determinar la forma como se interrelacionan en ese diálogo en particular.
Los sistemas de diálogo, usan los modelos de diálogo que, combinados con otros sistemas de procesamiento de lenguaje natural, permiten una interacción con los usuarios por medio del habla.
Son varios los enfoques que existen para la construcción de los sistemas de diálogo. Dos de estos enfoques son los sistemas basados en pregunta-respuesta y los sistemas de diálogos intencionales.
Sin importar cuál sea el enfoque a seguir para la elaboración de un sistema de diálogo (basado en intenciones o basado en pregunta-respuesta), es necesario contar con métricas que permitan medir la eficiencia de estos sistemas.
Las características de los diferentes modelos y sistemas de diálogo presentados en este artículo, sugieren que es posible la construcción de un modelo de diálogo que contribuya a solucionar las dificultades que se presentan en el proceso de educción de requisitos de software.
6. TRABAJO FUTURO
De la recopilación presentada, se desprenden algunas líneas de trabajo por explorar:
- Usando los diferentes enfoques para la construcción de modelos de diálogo que se presentaron en esta revisión de la literatura especializada, construir un modelo de diálogo para la captura de requisitos de una aplicación de software.
- Usando el modelo de diálogo desarrollado para la captura de requisitos, construir un sistema de diálogo que le permita a un interesado ajeno a la ingeniería de software, levantar los requisitos de un dominio en particular y construir el discurso en UN-Lencep [57], sin tener que recurrir a un analista humano.
- Definir o adaptar un conjunto de métricas que permitan establecer la calidad tanto del modelo como del sistema.
7. AGRADECIMIENTO
Este artículo se realizó en el marco del proyecto de Investigación “Un modelo de diálogo para la generación automática de especificaciones en UN-LENCEP” financiado por la DIME (Dirección de Investigación de la Sede Medellín—Universidad Nacional de Colombia).
REFERENCIAS
[1] RAE. Real Academia Española. Disponible en: http://www.rae.es. (Citado 20 de octubre de 2008).
[2] ZUBIZARRETA, J., Un modelo de diálogo para diálogos orientados por la tarea. España, Revista Procesamiento del lenguaje natural no. 13, 1993, pp. 289-304.
[3] MARINEAU, J., WIEMER, P., HARTER, D., OLDE, B., CHIPMAN, P., KARNAVAT, A., POMEROY, V., RAJAN, S. Y GRAESSER, A. Classification of speech acts in tutorial dialog. Proceedings of the workshop on modeling human teaching tactics and strategies at the Intelligent Tutoring Systems 2000 conference, Quebec, 2000, pp. 6571.
[4] ARONOFF, M. Y REES, J. The handbook of linguistics. Blackwell Handbooks in Linguistics, Oxford, 2001.
[5] XU, W. Y RUDNICKY, A. Language modeling for dialog system. Proceedings of the Sixth International Conference on Spoken Language Processing ICSLP, Beijing, 2000.
[6] MITKOV, R. The Oxford handbook of computational linguistics. Oxford University Press, Oxford, 2003.
[7] BLAYLOCK, N. Y ALLEN, J. A collaborative problem-solving model of dialogue. 6th SIGdial Workshop on Discourse and Dialogue, Lisbon, 2005, pp. 200211.
[8] VALLE, D., CALLE, J. Y MARTÍNEZ, P. Enfoque metodológico para incorporar conocimientos de dominio a sistemas de diálogo intencionales. Revista Procesamiento del lenguaje natural, No. 37, 2006.
[9] TORRES, F., SANCHOS, E. Y SEGARRA, E. Desarrollo de un gestor de diálogo basado en modelos estocásticos y dirigidos por la semántica. Revista Procesamiento del lenguaje natural, No. 29, 2002.
[10] DOSHI, F. Y ROY N. Efficient model learning for dialog management. Proceeding of the ACM/IEEE international conference on Human-robot interaction, Washington, 2007, pp. 6572.
[11] PELLOM, B., WARD, W., HANSEN, J., HACIOGLU, K., ZHANG, J., YU, X. Y PRADHAN, S. University of Colorado dialog systems for travel and navigation. Proceedings of the Human Language Technology Conference (HLT-2001), San Diego, 2001.
[12] VOORHEES, E. Overview of the TREC 2003 question answering track. Proceedings of the 12th Text Retrieval Conference, Washington, 2003.
[13] CALLE, J., GARCÍA A. Y MARTÍNEZ, P. Intentional processing as a key for rational behavior through Natural Interaction. Interacting with computers, No. 18, 2006, pp. 14191446.
[14] GROSZ, B. Y SIDNER, C. Attention, intention, and the structure of discourse. Computational Linguistics, No. 12, 1986, pp. 175204.
[15] GROSZ, B. The representation and use of focus in dialogue understanding. California, Technical Report 151 Artificial Intelligence Center sri international, 1977.
[16] GROSZ, B. Discourse analysis. D. Walker (Ed.), Understanding Spoken Language. Ch. IX. ElsevierNorth-Holland, New York, pp. 235268.
[17] GROSZ, B. Focusing in dialog. Theoretical Issues in Natural Language Processing, 1978b, pp. 96103.
[18] YAÑEZ, A. El enunciado y el contexto enunciativo: hacia la pragmática. Revista de comunicación, No. 11, 2000.
[19] ABAITUA, J., RUIZ, A., Y ZUBIZARRETA, J. Un compilador de LFG y su aplicación al Euskara. Revista Procesamiento del lenguaje natural, No. 9, 1991, pp. 177191.
[20] RELLY, R., FERRARI G. Y PRODANOF, I. Framework for a model of dialogue. Proceedings of the 12th conference on Computational linguistics, Budapest, 1988, pp. 540543.
[21] GRICE, H. Logic and conversation. Syntax and semantics III. Speech Acts, 1975, pp. 4158.
[22] AUSTIN, J. How to do things with words. Oxford University Press, Oxford, 1962.
[23] SEARLE, J. Speech acts: an essay in the philosophy of language. Cambridge University Press, Cambridge, 1969.
[24] SPERBER, D. Y WILSON, D. Relevante: communication and cognition. Blackwell, Oxford, 1995.
[25] MARTÍNEZ, C., SANCHIS, E., GARCÍA, F. Y AIBAR, P. A labeling proposal to anotate dialogue. Proceedings of third international conference on Language resources an evaluation, Las Palmas, 2002, pp. 15771582.
[26] FERNÁNDEZ, R., GINZBURG, J. Y LAPPIN S. Classifying non-sentential utterances in dialogue: A machine learning approach. Computational Linguistics, 2007, to appear.
[27] LITMAN, D., HIRSCHBERG, J. Y SWERTS, M. Characterizing and predicting corrections in spoken dialogue systems. Computational Linguistics, No. 32, 2006, pp. 437438.
[28] LEVIN, L., RIES, K., THYMÉ-GOBBEL A. Y LAVIE, A. Tagging of speech acts and dialogue games in spanish call home. Towards Standards and Tools for Discourse Tagging: Proceedings of the Workshop, Maryland, 1999, pp. 42-47.
[29] CLARK, A. Y POPESCU-BELIS, A. Multi-level dialogue act tags. Proceedings of SIGDIAL '04 (5th SIGDIAL Workshop on Discourse and Dialog), Cambridge, 2004.
[30] KOIT, M. Constructing a model of dialog. Proceedings of the 12th conference on Computational linguistics, no. 1, Budapest, 1988, pp. 332334.
[31] METZING, J. Atns used as a procedural dialog model. Proceedings of the 8th conference on Computational linguistics, Tokyo, 1980, pp. 487491.
[32] JI, G. Y BILMES, J. Backoff model training using partially observed data: Application to dialog act tagging. Proceedings of the Human Language Technology Conference of the NAACL, New York, 2006, pp. 280287.
[33] STENT, A. Rhetorical structure in dialog. Proceedings of the 1st International Natural Language Generation Conference (INLG'2000), Mitzpe Ramon, 2000.
[34] ARIAV, G. Y CALLOWAY L. Designing conceptual models of dialog: a case for dialog charts. ACM SIGCHI Bulletin, No. 20, 1988, pp. 2327.
[35] CALLE, J. Interacción natural mediante procesamiento intencional: el modelo de hilos en diálogos. PhD Thesis, Technical University of Madrid, 2004.
[36] MORIK, K. User modeling, dialog structure, and dialog strategy in HAM-ANS. Proceedings of the second conference on European chapter of the Association for Computational Linguistics, Geneva, 1985, pp. 268273.
[37] YEH, P., PORTER, B. Y BARKER, K. Matching utterances to rich knowledge structures to acquire a model of the speaker's goal. Proceedings of the 3rd international conference on Knowledge capture, Alberta, 2005, pp. 129136.
[38] COHEN, P. Dialogue modeling. Survey of the state of the art in human language technology. Cambridge University press On-line, Cambridge, 1998. Disponible en: http://cslu.cse.ogi.edu/HLTsurvey/indextop.html (Citado 22 de Enero de 2008).
[39] MCTEAR, M. Spoken dialogue technology: enabling the conversational user interface. ACM Computing Surveys, 2002, pp. 90169.
[40] LITMAN, D. Y ALLEN, J. Discourse processing and commonsense plans. Intentions in communication, 1990, pp. 365388.}
[41] XU, J., LICUANAN, A. Y WEISCHEDEL, R. Answering definitional questions. Proceedings of the Text Retrieval Conference TREC, Gaithersburg, 2003.
[42] NANDI, R. Y BANDYOPADHYAY, S. Dialogue based question answering system in Telugu. Proceedings of the workshop on Multilingual Question Answering ELQA06, Trento, 2006, pp. 5361.
[43] BERNSEN, N., DYBKJAER, H. Y DYBKJAER, L. Design interactive speech systems, from first ideas to user testing. Springer Verlag, Berlin, 1998.
[44] WAI, C., MENG, H. Y PIERACCINI, R. Scalability and portability of a belief network-based dialog model for different application domains. Proceedings of the first international conference on Human language technology research, San Diego, 2001, pp. 16.
[45] KAZEMZADEH, A., LEE, S. Y NARAYANAN, S. Using model trees for evaluating dialog error conditions based on acoustic information. Proceedings of the 1st ACM international workshop on Human-centered multimedia, Santa Barbara, 2006, pp. 109114.
[46] GATIUS, M. Y GONZÁLEZ, M. Un sistema de diálogo multilingüe dirigido por la semántica. Revista Procesamiento del lenguaje natural, No. 34, 2005.
[47] GARCÍA, F., SANCHÍS,E., HURTADO, L. y Segarra, E. Modelos específicos de comprensión en un sistema de diálogo. Revista Procesamiento del lenguaje natural, No. 31, 2003, pp. 99106.
[48] WHITTAKER, E., HAMONIC, J., YANG, D., Klingberg, T. y Furui, S. Monolingual Web-based factoid question answering in Chinese, Swedish, English and Japanese. Proceedings of the workshop on Multilingual Question Answering MLQA06, Trento, 2006, pp. 4553.
[49] KATZ, B., FELSHIN, S., YURET, D., IBRAHIN, A., LIN, J., MARTON, G., JEROME, A. Y TEMELKURAN, B. OMNIBASE: Uniform access to heterogeneous data for question answering. Proceedings of the 7th International Workshop on Applications of Natural Language to Information systems, Stockholm, 2002.
[50] ZHENG, Z. AnswerBus news engine. The Twelfth International World Wide Web Conference (WWW 2003), Budapest, 2003.
[51] QI, H., OTTERBACHER, J., WINKEL, A. Y DRAGOMIR R. Question answering and novelty tracks. The 11th Text Retrieval Conference, Gaithersburg, 2002.
[52] HARABAGIU, S., MOLDOVAN, D., PASCA, M., MIHALCEA, R., SURDEANU, M., BUNESCU, R., GIRJU, R., RUS, V. Y MORARESCU, P. FALCON: Boosting knowledge for answer engines. Proceedings of the Text Retrieval Conference, Gaithersburg, 2000.
[53] MCGLASHAN, S., BURNETT, D., CARTER, J., DANIELSEN, P., FERRANS, J., HUNT, A., LUCAS, B., PORTER, B., REHOR, K. Y TRYPHONAS, S. Voice Extensible Markup Language (VoiceXML) Version 2.0. Disponible en: http://www.w3.org/TR/voicexml20/ (Citado 20 de octubre de 2008).
[54] RODRÍGUEZ, L., PÉREZ, D. Y GARCÍA C. Diseño e integración con VXML de un sistema de diálogo para la consulta de correo electrónico en lenguaje natural. Actas de las II Jornadas en Tecnologías del Habla, Granada, 2002.
[55] BONAFONTE, A., AIBAR, P., CASTELL, N., LLEIDA, J., MARIÑO, E., SANCHOS, E., Y TORRES M. Desarrollo de un sistema de diálogo oral en dominios restringidos. I jornadas en tecnologías del habla, Sevilla, 2000.
[56] PINEDA, L., MASSÉ, A., MEZA, I., SALAS, M., SCHWARZ, E., URAGA, E. Y VILLASEÑOR, L. The DIME project. Lecture Notes in Computer Science, No. 2313, 2002.
[57] ZAPATA, C., GELBUKH, A. Y ARANGO, F. Pre-conceptual schema: a conceptual-graph-like knowledge representation for requirements elicitation. Lecture Notes in Computer Science, No. Vol. 4293, 2006, pp. 2737.
How to Cite
IEEE
ACM
ACS
APA
ABNT
Chicago
Harvard
MLA
Turabian
Vancouver
Download Citation
Article abstract page views
Downloads
License
Copyright (c) 2009 DYNA
This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License.
The author of a paper accepted for publication in any of the journals published by the School of Mines will yield all the property to the National University of Colombia rights free of charge, within which include article: the right to edit, publish, reproduce and distribute both print and digital media, as well as including in an article in international indexes and / or databases, likewise, it enables the publisher to use images, tables and/or graphic material presented in Article for designing covers or posters of the magazine. By assuming the economic rights of the article, it may be reproduced partially or totally in any printed or digital media without express permission of the same.