¿Por qué necesitamos una generación inteligente de texto?
Si bien el concepto de lenguaje se emplea en muy diversos contextos, siempre se encuentra asociado a una forma de comunicación que persigue un objetivo definido. Los seres humanos suelen comunicarse a través del lenguaje escrito o hablado -el lenguaje natural– para intercambiar o pedir información, persuadir, advertir, etc. El aumento y avance de la tecnología, así como el desarrollo permanente de nuevos entornos digitales, actúan como promotores de la creación de sistemas y aplicaciones, de su perfeccionamiento en términos de comunicación e interacción entre el hombre y la computadora. Sin embargo, las capacidades actuales de los computadores no permiten que las tareas de comprensión y generación se equiparen a las tales capacidades en humanos.
El Procesamiento del Lenguaje Natural (PLN) es el área de la inteligencia artificial que se ocupa del análisis y la representación automática del lenguaje humano. Es responsable de las tecnologías desarrolladas para comprenderlo y de las que lo generan. Por lo tanto, es una pieza indispensable en el progreso de las aplicaciones inteligentes para los nuevos entornos digitales.
En relación con el área de Generación de Lenguaje Natural (GLN), según uno de los referentes fundamentales del área (Reiter y Dale, 2000), a la hora de definir formalmente las entradas de un sistema GLN, además de la fuente de conocimiento, es necesario definir un objetivo comunicativo que condicione la generación para que el resultado informe, entretenga o persuada, explique o recomiende, según corresponda. Debido a la complejidad del proceso de generación, el objetivo comunicativo se suele asumir en el diseño del sistema. Así pues, la meta comunicativa permanece invariable o restringida a un conjunto reducido de opciones previamente determinadas por la aplicación que se va a construir.
Además, para el PLN en general, la investigación y el desarrollo de sistemas más flexibles se ha convertido en una prioridad, como lo demuestra el enorme esfuerzo invertido en las técnicas de inteligencia computacional estadística (Bellegarda y Monz, 2016). Los proyectos construidos sobre estas premisas avanzan bajo el supuesto de que el aprendizaje dinámico de los datos aumenta la adaptabilidad del sistema a los diferentes contextos. Esto es posible ahora gracias a los avances tecnológicos y a la enorme cantidad de información heterogénea disponible.
El proyecto Integer ha sido concebido como un impulso para nuevos enfoques de la generación automática de lenguaje natural que se traduzcan en tecnologías de producción de texto fácilmente adaptables a objetivos comunicativos específicos no embebidos en el sistema, propiciando de este modo aproximaciones que puedan responder a múltiples circunstancias.
Bibliografía
- Bellegarda, J.R., and C. Monz (2016). State of the art in statistical methods for language and speech processing. Computer Speech & Language, 35: 163-184.
- Reiter, E. and R. Dale (2000). Building Natural Language Generation Systems. Cambridge University Press.