Seminář: Multi–relační mining a asociační pravidla, KL–Collaps module (Nová implementace GUHA procedury COLLAPS)

Datum a čas 2. 12. 2004 10:00 - 11:30
Místnost 403 NB

Multi–relační mining a asociační pravidla

Prezentující: Tomáš Karban

Základním cílem multi–relačního data miningu je dobývání znalostí z více relačně svázaných tabulek, namísto jejich předzpracování do jediné datové matice. Novým přínosem je použití virtuálních atributů odvozených z podřízených tabulek ve formě asociačních pravidel (zpravidla fundované implikace), což nemá ekvivalent v běžných formách předzpracování dat. Problémem je ovšem explozivní nárůst velikosti úloh. Částí příspěvku bude rovněž prezentace práce na přípravě umělých databází pro multi–relační data mining, tedy reverzní postup schovávání‘ zadaných asociačních pravidel do generovaných dat s danou strukturou.‘

KL–Collaps module (Nová implementace GUHA procedury COLLAPS)

Prezentující: Václav Lín

KL–Collaps is a sub–module of KL–Miner, designed to closely examine the patterns discovered with KL–Miner. KL–Collaps implements a significant part of functionality of GUHA procedure COLLAPS that was designed in late 1970’s. The procedure takes as input a two–dimensional contingency table, generates all interesting‘ 2 x 2 tables derivable from the contingency table, and outputs a set of patterns that can be understood as association rules describing ‚sources of dependence‘, or the strongest interactions, in the input contingency table. This is useful e.g. when we reject the hypothesis of independence (via the Chi^2 test) but dependence between the row and column attribute is hard to understand (think of contingency tables larger than 10 x 10). In this way, KL–Collaps helps the user to gain some additional insight into the results of KL–Miner.‘