Conference Paper (international conference)
, , , ,
: Proceedings of the International Conference on Statistics - Investment in the Future, p. 1-7 , Eds: Krovák J.
: Statistics - Investment in the Future, (Prague, CZ, 06.09.2004-07.09.2004)
: CEZ:AV0Z1075907
: 507752, EC, GA402/02/1271, GA ČR
: statistical databases, information analysis, statistical models
(eng): We describe a new method of information oriented data analysis (data mining) based on a quick evaluation of a virtual list of several hundreds of thousands of sub-populations. The sub-populations can be ordered according to different criteria like conditional probability of a value, conditional entropy of a variable or mutual informativity of a pair of variables. In this way we can identify causal relations between values and variables in a qualitatively new way.
(cze): V práci je popsána kvalitativně nová možnost informační analýzy statistických databází (datamining) s využitím statistického modelu. Metoda je založena na rychlém vyhodnocení virtuálního seznamu několika set tisíc subpopulací a jejich uspořádání z hlediska zvoleného kriteria, jako je např. podmíněná pravděpodobnost nějaké vlastnosti, podmíněná entropie nebo Shannonovská informace dvojice proměnných. Uvedeným způsobem lze identifikovat např. kauzální vztahy nominálních proměnných
: 05A, 05W, 05R
: AO