De la información al conocimiento: razonando con información negativa e imprecisa (TIN2014-59471-P)

El Análisis de Conceptos Formales (FCA) se ha visto reconocido recientemente como una alternativa sólida al proceso de la adquisición y tratamiento de la información para su posterior uso en aplicaciones usando técnicas de razonamiento automático. Más concretamente, se ha visto reconocido mediante un aumento muy significativo de aplicaciones en áreas muy diversas: biomedicina, turismo, educación, redes sociales, etc.

Gran parte de este creciente interés radica en disponer de un marco único en el que poder desarrollar de principio a fin el ciclo que nos lleva de la información al conocimiento y, sobre él, poder realizar tareas de razonamiento automático. Existen otras aproximaciones que dan solución parcial a este problema. Hay diversas técnicas usadas con mucho éxito en tareas de mineria de datos, clasificación, etc. Pero una vez llevadas a cabo estas tareas, debemos hacer uso de otras áreas para trabajar con el conocimiento adquirido.

Sin embargo, una gran diferencia entre gran parte de las aproximaciones anteriores y FCA es que ésta busca recopilar todo el conocimiento existente en el sistema. Así, mientras en otras áreas el término aproximado es habitual, aquí nos encontramos con un requerimiento importante en cuanto a la completitud semántica. Evidentemente este objetivo induce una gran complejidad y es inevitable que el sistema sea representado por retículos de conceptos de tamaño significativos o por sistemas de implicación igualmente grandes. Sin embargo, se ha hecho un gran esfuerzo últimamente en el desarrollo de técnicas y métodos eficientes que han allanado el terreno en el marco del FCA clásico.

Muchas nuevas aplicaciones están demandando una mayor potencia expresiva. Una demanda ya planteada ha sido la de disponer de una generalización que integre adecuadamente la información imprecisa. Así, por ejemplo queremos poder flexibilizar el sistema de modo que en lugar de afirmar que un paciente tiene un cierto síntoma o no lo tiene, pueda indicarse el grado en que creemos que el paciente padece dicho síntoma. La principal respuesta a este problema pasa por la extensión de los contextos formales (datasets) a atributos multivaluados. Este cambio demanda un desarrollo nuevo de todo el marco, desde la extracción de implicaciones hasta las lógicas que las manejan. Precisamente el desarrollo de nuevas lógicas para este problema fue el principal objetivo de un proyecto TIN anterior de este grupo.

Como segunda demanda expresiva, nos hemos fijado en que hasta ahora todos los trabajos relacionados con FCA hacen uso de la información constatada, es decir la presencia de un atributo. Sin embargo, un reto tratado por muy pocos autores consiste en incorporar a este marco la información aportada por la ausencia de un atributo en el objeto. Así por ejemplo, en lugar de ceñirnos a expresar que «si un paciente padece un síntoma, debemos considerar tal enfermedad en su diagnóstico», queremos abrir la puerta a ampliar el sistema para poder indicar también que «no consideraremos tal otra». Esta novedosa generalización es la segunda columna de esta propuesta y en ella incluiremos el desarrollo de aspectos relacionados con el descubrimiento de conocimiento, su representación, la manipulación y el razonamiento automático.

El objetivo general del proyecto es incorporar en la información del sistema grados de certidumbre e información negativa y extender los elementos de FCA para disponer de un marco general para poder usarlo en aplicaciones reales.

Contenido relacionado: