Desarrollo de un marco global para inferir nuevo conocimiento usando implicaciones y sus generalizaciones (TIN2017-89023-P)

Los datos generados hoy en día son almacenados en conjuntos de datos sin estructura, en concreto en relaciones binarias objeto-estructura. Se tiene que seleccionar un representación del conocimiento adecuada para describir la información y manipularla. El lenguaje que se utiliza tiene un impacto directo en el poder expresivo y la eficacia de su manipulación. Cuanto más expresivo es un lenguaje, peor rendimiento tiene nuestro método: se debe alcanzar un equilibrio.

Para este propósito se ha seleccionado un recurso muy popular: las reglas if-then, muy usadas en diversos campos (base de datos, programación lógica, etc) y con muchos puntos de vista e interpretaciones (causa-efecto, acciones ejecutables, etc). Las razones, a nuestro entender, de que este método esté tan extendido son su sencillez y su idoneidad para emular el razonamiento humano.

Sin embargo, cada vez se demanda más el poder expresivo. En los framework clásicos, el sistema solo considera la información provista por el usuario, pero no considera su ausencia. Los atributos negativos dan solución a esto, manteniendo los conjuntos de datos. En otros contextos, se demanda asociar cada trozo de información con algún grado, interpretado como incertidumbre, honradez o vaguedad. El uso de conjuntos difusos proveen tanto lenguaje enriquecido como una correcta manipulación de la información. Otra vía para añadir una medida de la exactitud de las reglas es considerar reglas asociadas donde la confianza es introducida. En cuanto a los objetos y atributos, se puede considerar nueva información provista por los medios supuestos. Aunque los modelos relacionales se aproximen a esta situación, los conjuntos de datos triádicos se aproximan de una manera más sencilla. Finalmente, se planea combinar dos de la generalizaciones a una única. Así pues este es el ejemplo de que la mezcla de soluciones difusas y negativas pueden dirigirse a la lógica intuicionista, donde dos valores independientes pueden ser ligados a una afirmación y su negación.

El objetivo principal en enseñar como todas estas generalizaciones pueden aproximarse en una forma uniforme dentro del análisis de conceptos formales de los entornos de trabajo. Se planea considerar para este propósito todas las generalizaciones antes expuestas: negación, difusa, triádico, precisa e intuicionista. Se propone tratar con los problemas en todas estas generalizaciones, enunciado como un ambicioso desafío: cómo comprobar eficientemente si la nueva información puede ser deducida desde el conocimiento almacenado. se abordará este problema por medio del operador de cierre de atributos. Este operador recibe un conjunto de atributos y usa un conjunto de reglas para inferir el conjunto de atributos maximal más fuertemente asociado con la entrada. La clave del trabajo propuesto es la simplificaciones del operador de cierre. Esto aplica un conjunto de simplificación de equivalencias lógicas. Este operador tiene un gran propiedad: produce una salida dual. Además al conjunto de atributos cerrados, también ser provee un conjunto complementario de de implicaciones que pueden ser vistas como el conocimiento que permanece en los atributos no incluidos en el conjunto cerrado de salida. Esta segunda parte de la salida es una herramienta muy útil para ir más allá en el racionamiento sin costes adicionales, dado que es generado a la vez que el cierre es creado. Este coste extra no es trivial dado que la extracción del conjunto de reglas desde un conjunto de datos tiene una complejidad exponencial.

Contenido relacionado: