Publication details

Information analysis of census data by using statistical models

Conference Paper (international conference)

Grim Jiří, Hora J., Boček Pavel, Somol Petr, Pudil P.


serial: Proceedings of the International Conference on Statistics - Investment in the Future, p. 1-7 , Eds: Krovák J.

action: Statistics - Investment in the Future, (Prague, CZ, 06.09.2004-07.09.2004)

research: CEZ:AV0Z1075907

project(s): 507752, , GA402/02/1271, GA ČR

keywords: statistical databases, information analysis, statistical models

abstract (eng):

We describe a new method of information oriented data analysis (data mining) based on a quick evaluation of a virtual list of several hundreds of thousands of sub-populations. The sub-populations can be ordered according to different criteria like conditional probability of a value, conditional entropy of a variable or mutual informativity of a pair of variables. In this way we can identify causal relations between values and variables in a qualitatively new way.

abstract (cze):

V práci je popsána kvalitativně nová možnost informační analýzy statistických databází (datamining) s využitím statistického modelu. Metoda je založena na rychlém vyhodnocení virtuálního seznamu několika set tisíc subpopulací a jejich uspořádání z hlediska zvoleného kriteria, jako je např. podmíněná pravděpodobnost nějaké vlastnosti, podmíněná entropie nebo Shannonovská informace dvojice proměnných. Uvedeným způsobem lze identifikovat např. kauzální vztahy nominálních proměnných

Cosati: 05A, 05W, 05R

RIV: AO