Publication details

Feature Selection Based on Mutual Correlation

Journal Article

Haindl Michal, Somol Petr, Ververidis D., Kotropoulos C.


serial: Lecture Notes in Computer Science vol.19, 4225 (2006), p. 569-577

action: Iberoamerican Congress on Pattern Recognition. CIARP 2006 /11./, (Cancun, MX, 14.11.2006-17.11.2006)

research: CEZ:AV0Z10750506

project(s): 507752, , 1ET400750407, GA AV ČR, 1M0572, GA MŠk, IAA2075302, GA AV ČR

keywords: feature selection

preview: Download

abstract (eng):

Feature selection is a critical rocedure in many pattern recognition applications. There are two distinct mechanisms for feature selection namely the wrapper methods and the filter methods. The filter methods are generally considered inferior to wrapper methods, however wrapper methods are computationally more demanding than filter methods. A novel filter feature selection method based on mutual correlation is proposed. We assess the classification performance of the proposed filter method by using the selected features to the Bayes classifier. Alternative filter feature selection methods that optimize either the Bhattacharrrya distance or the divergence are also tested. Furthermore, wrapper feature selection techniques employing several search strategies such as the sequential forward search, the oscillating search, and the sequential floating forward search are also included in the comparative study. A trade off between the classification accuracy and the feature set dimensionality is demonstrated on both two benchmark datasets from UCI repository and two emotional speech data collections.

abstract (cze):

Výběr příznaků je kritická procedura v mnoha aplikacích rozpoznávání. Metody výběru příznaků se dělí do dvou kategorií wrapper metody a filtrační metody. Filtrační metody se obecně považují za horší než wrapper metody nicméně jsou výpočetně méně náročné. Naše nová filtrační metoda výběru příznaků je založena na vzájemné korelaci. Klasifikační účinnost navržené metody je ověřena na bayesovském klasifikátoru a alternativních filtračních metodách výběru příznaků, které optimalizují Bhattacharryovu vzdálenost nebo divergenci. Metoda je dále porovnána s wrapperovými metodami - sekveční dopředné prohledávání, oscilační hledání a sekveční dopředné plovoucí prohledávání. Vztah mezi klasifikační přesností a dimenzionalitou příznakového prostoru je testován na dvou benchmarkových souborech z UCI databáze a dvou souborech z databáze emocionálních řečových záznamů.

Cosati: 09K

RIV: BD