Publication details

Are Better Feature Selection Methods Actually Better? Discussion, Reasoning and Examples

Conference Paper (international conference)

Somol Petr, Novovičová Jana, Pudil Pavel


serial: Proceedings of the International Joint Conference on Biomedical Engineering Systems and Technologies - BIOSTEC 2008, p. 246-253

action: International Conference on Health Informatics, (Funchal Madeira, PT, 28.01.2008-31.01.2008)

research: CEZ:AV0Z10750506

project(s): GA102/07/1594, GA ČR, 1M0572, GA MŠk, 2C06019, GA MŠk, IAA2075302, GA AV ČR, 507752,

keywords: feature selection, subset search, performance estimation, classification accuracy

preview: Download

abstract (eng):

One of the hot topics discussed recently in relation to pattern recognition techniques is the question of actual performance of modern feature selection methods. Feature selection has been a highly active area of research in recent years due to its potential to improve both the performance and economy of automatic decision systems in various applicational fields, with medical diagnosis being among the most prominent. Feature selection may also improve the performance of classifiers learned from limited data, or contribute to model interpretability.The number of available methods and methodologies has grown rapidly while promising important improvements. Yet recently many authors put this development in question, claiming that simpler older tools are actually better than complex modern ones -- which, despite promises, are claimed to actually fail in real-world applications.

abstract (cze):

Jedno z aktuálních témat diskutovaných v současné době ve vztahu k oboru rozpoznávání je otázka skutečné účinnosti moderních metod výběru příznaků. Výběr příznaků je stále zkoumaná oblast neboť může zlepšit jak účinnost tak i hospodárnost automatických rozhodovacích systémů v mnoha aplikačních oblastech, z nichž mezi nejdůležitější patří lékařská diagnostika. Výběr příznaků může také zlepšit účinnost klasifikátorů, navržených na základě omezeného množství dat, nebo přispět k interpretaci modelů. Zejména poslední dobou bylo vyvinuto mnoho metod a metodologií slibujících významné zlepšení. Nicméně objevila se také řada kritických příspěvků prohlašujících, že jednoduché staré nástroje jsou ve skutečnosti lepší než složité moderní metody, které, navzdory slibům, selhávají v reálných aplikacích. Toto tvrzení je zkoumáno v článku a je ukázáno několik ilustrativních příkladů, vyvozeny závěry a doporučení týkající se očekávané účinnosti metod výběru příznaků.

RIV: IN