Módulo A: Modelado Computacional de Objetivos Comunicativos
Dado un objetivo comunicativo como parte de la entrada para el proceso de generación, o lo que es lo mismo, el propósito del texto a generar, como por ejemplo, informar, narrar, resumir, persuadir, recomendar, criticar, quejarse, etc., este proyecto propondrá un enfoque dinámico para determinar automáticamente el plan y la estructura del texto que debe ser generado.
La finalidad de este módulo es obtener como resultado múltiples planificadores de textos, es decir, modelos para estructurar y producir una amplia variedad de textos en función del objetivo comunicativo que se persiga. Para lograr este objetivo y obtener los resultados anteriormente mencionados, este módulo se compone de dos tareas, que se explican a continuación.
Este módulo permitirá cumplir con los objetivos OBJ1, OBJ2 y OBJ3.
Actividad 1. Definición y caracterización de los objetivos comunicativos
El objetivo de esta tarea es analizar, definir y caracterizar el objetivo comunicativo asociado a un determinado texto. En primer lugar, se realizarán un análisis y revisión de la literatura exhaustivos para obtener una nueva taxonomía —a partir de las ya existentes (Jakobson, 1960; Tedick, 2002; Hébert, 2011)— que tenga en cuenta los aspectos más relevantes y que pueda ser abordaba computacionalmente. Posteriormente, se procederá a identificar las características específicas y patrones del lenguaje a través de sus elementos y expresiones que se asocian de forma clara y unívoca a cada uno de los objetivos comunicativos definidos. Para ello, se utilizarán herramientas y recursos de PLN.
Como resultado de esta tarea se obtendrá una nueva taxonomía para clasificar y caracterizar a nivel lingüístico los objetivos comunicativos, que sea adecuada desde un punto de vista computacional. Dicho conocimiento se utilizará en la tarea A.2 para el desarrollo automático de los modelos comunicativos del lenguaje y su posterior materialización en planificadores de texto.
Hito: taxonomía de los objetivos comunicativos
Actividad 2. Definición y obtención de modelos comunicativos del lenguaje (planificadores de textos)
Definidos y caracterizados los objetivos comunicativos, esta tarea consiste en aprender automáticamente la estructura de diversos textos asociados a un objetivo comunicativo. Es decir, aprender un modelo comunicativo del lenguaje que se materializará en un planificador de texto. Esto se corresponde con la etapa de macroplanificación del proceso tradicional de la GLN, cuya finalidad es decidir “qué hay que decir”. En el enfoque propuesto en este proyecto, el “qué decir” será a nivel de estructura y de organización del texto, dejando la decisión sobre el tipo específico de contenido que se incluirá para el siguiente módulo. Los planificadores de texto se obtendrán utilizando corpus de documentos asociados a un mismo objetivo comunicativo.
Se trata de una tarea compleja, puesto que por un lado un mismo documento puede tener un objetivo comunicativo predominante y su contenido contener a su vez otros objetivos comunicativos. Por ejemplo, en el caso de reseñas de hoteles, el objetivo comunicativo predominante puede ser “quejarse” si al usuario no le ha gustado el hotel en el que se ha alojado. No obstante, una parte de la reseña puede contener texto exponiendo su experiencia en el hotel. Así, nos encontraríamos también con el subobjetivo comunicativo “informar” —”me alojé en este hotel en febrero de 2017 porque tenía un evento en esta ciudad […]”—. Por otro lado, la riqueza expresiva de la que dispone un idioma y su constante evolución hace que la manera de escribir vaya cambiando con el tiempo, y se permita cierta flexibilidad o variabilidad en el tipo de estructuras presentes en los textos. Esto hace que varios textos sobre la misma temática, compartiendo el mismo objetivo comunicativo, se puedan escribir de muchas formas, lo que constituye un reto adicional para el proyecto.
Para realizar esta tarea con éxito, se desarrollarán modelos de aprendizaje automático, incluyendo algoritmos de aprendizaje profundo (deep learning), en los que se integrarán las características específicas relativas a la caracterización de los objetivos comunicativos —la intención, por ejemplo— para complementar características lingüísticas tradicionales —raíz o categoría morfológica de la palabra, entre otros— para aprender los aspectos únicos y clave de cada texto que los identifique con su objetivo comunicativo.
Como resultado de esta tarea, los modelos comunicativos del lenguaje obtenidos se materializarán en diferentes planificadores de texto, y los recursos y herramientas generados se pondrán a disposición de la comunidad de investigadores.
Hito: obtener planificadores de texto asociados a objetivos comunicativos
Bibliografía
- Jakobson, R. (1960). Closing statements: Linguistics and Poetics, Style in language, T.A. Sebeok, New-York.
- Tedick, D.J. (Ed.). (2002). Proficiency-oriented language instruction and assessment: A curriculum handbook for teachers. CARLA Working Paper Series. Minneapolis, MN: University of Minnesota, The Center for Advanced Research on Language Acquisition
- Hébert, L. (2011). The Functions of Language. Signo.