Ústav teorie informace a automatizace

Jste zde

Bibliografie

Conference Paper (international conference)

Time-domain Blind Audio Source Separation Using Advanced Component Clustering and Reconstruction

Koldovský Zbyněk, Tichavský Petr

: 2008 Hands-free Speech Communication and Microphone Arrays, p. 216-219

: Hands-free Speech Communication and Microphone Arrays 2008, (Trento, IT, 06.05.2008-08.05.2008)

: CEZ:AV0Z10750506

: 1M0572, GA MŠk, GP102/07/P384, GA ČR

: blind source separation, audio signals

(eng): We present a novel time-domain method for blind separation of convolutive mixture of audio sources (the cocktail party problem). The method allows efficient separation with good signal-to-interference ratio (SIR) and signal-to-distortion ratio (SDR) using short data segments only. In practice, we are able to separate 2-4 speakers from audio recording of the length less than 6000 samples, which is less than 1-s in the 8-kHz sampling. The average time needed to process the data with filter of the length 20 was 2.2 seconds in Matlab v.-7.2 on an ordinary PC with 3GHz processor.

(cze): V práci je prezentována nová metoda slepé separace konvolutorních směsí audio signálů, pracující v časové oblasti. Metoda umožňuje efektivní separaci (měřeno pomocí poměru signálu vůči šumu a signálu vůči zkreslení) za použití pouze krátkých úseků dat. V praxi umožňuje separovat promluvy dvou až čtyř současně hovořících řečníků z audionahrávek získaných stejným počtem mikrofonů o délce 6000 vzorků, což při vzorkovací frekvenci 8kHz představuje méně než 1s. Výpočetní čas pro inverzní filtr délky 20 je 2.2s v Matlabu na běžném PC s 3GHz procesorem.

: BI

07.01.2019 - 08:39