/ / porovnávanie zvukových vzorov v matlabe - matlab, spektrogram

audio zosúladenie vzoru v MATLAB - matlab, spektrogram

Môže mi niekto, prosím, predstaviť tento problém v Matlabe,

Mám 4.WAV súbory, ktoré obsahujú cvrlikanie vtákov. Každý súbor .wav predstavuje iného vtáka. Vzhľadom na vstupný súbor .wav sa musím rozhodnúť, ktorý vták to je. Viem, že musím urobiť porovnanie frekvenčného spektra, aby som sa dostal k riešeniu. ale neviem, ako by som mal používať spektrogram, aby mi pomohol dostať sa tam.

PS: Viem však, čo robí spektrogram a napriek tomu do toho vykreslil niekoľko súborov .wav

odpovede:

1 pre odpoveď č. 1

Existuje niekoľko metód na rozpoznávanie problémov, ako je tá, o ktorej hovoríte.

Môžete použiť frekvenčnú analýzu ako FFT s funkciou matlab
S = SPECTROGRAM(X,WINDOW,NOVERLAP)

v SPECTROGRAM musíte v premennej definovať časové okno signálu, ktorý sa má analyzovať WINDOW, Môžete použiť obdĺžnikové okno (príklad WINDOW = [1 1 1 1 1 1 1 ... 1]) s počtom hodnôt rovnajúcim sa požadovanej dĺžke. Existuje veľa okien na použitie: hanning, hamming, blackman. Mali by ste použiť ten, ktorý je pre váš problém lepší. NOVERLAP je počet bodov, ktoré sa vaše okná pohybujú v jednom kroku.

Okrem tohto prístupu je vlnová transformácia tiež dobrou technikou na vyriešenie vášho problému. Matlab má tiež dobrý súbor nástrojov na použitie diskrétnych a spojitých vlniek.


1 pre odpoveď č. 2

Môžete skúsiť vyriešiť problém Sieť s hlbokou vierou

Tu je niekoľko užitočných článkov:

Aby sme to zhrnuli, namiesto manuálneho vyladenia funkcií použite MKP alebo Autoencoder extrahovať prvky (bázy), ktoré predstavujú pozorované zvukové vzorky, a potom spustiť učiaci sa algoritmus.

Na zaškolenie DBN budete potrebovať viac ako 4 zvukové vzorky, ale stojí za to vyskúšať, pretože tento prístup v minulosti ukázal sľubné výsledky.

Táto správa môže byť tiež užitočná.


0 pre odpoveď č. 3

to sa môže ukázať ako komplikovaný problém. Na začiatok vám odporúčam rozdeliť každý záznam na pevne stanovenú dĺžku snímok, napríklad 20 ms s prekrývaním 10 ms, potom extrahovať fft z týchto snímok a získať nejakú maximálnu energetickú frekvenciu. hodnoty pre každý rámec. Ako posledný krok porovnajte frekvencie snímok spolu a stanovte výsledok výberom maximálnej korelácie