/ / Ako previesť mel spektrogram na log-škálovaný mel spektrogram - python, audio, rozpoznávanie reči, spektrogram, librosa

Ako konvertovať spektrogram mel na log-scaled mel spektrogram - python, audio, rozpoznávanie reči, spektrogram, librosa

čítal som tento papier o environmentálnej hlukovej diskriminácii pomocou. \ tConvolution Neural Networks a chceli reprodukovať svoje výsledky. Konvertujú WAV súbory do log-škálovaných mel spektrogramov. Ako to robíte? Som schopný previesť WAV súbor na mel spektrogram

y, sr = librosa.load("audio/100263-2-0-117.wav",duration=3)
ps = librosa.feature.melspectrogram(y=y, sr=sr)
librosa.display.specshow(ps, y_axis="mel", x_axis="time")

mel spektrogram

Som tiež schopný zobraziť ako logaritmický spektrogram:

librosa.display.specshow(ps, y_axis="log", x_axis="time")

logicky zmenšený obrázok

Je zrejmé, že vyzerajú inak, ale skutočný spektrogram ps je rovnaký. Používanie librosa, Ako môžem previesť tento melspectrogram do logaritmicky zmeneného melspectrogramu? Okrem toho, čo je použitie logaritmického spektrogramu oproti originálu? Je to len zníženie rozptylu domény frekvencie, aby bolo porovnateľné s časovou osou, alebo niečo iné?

odpovede:

0 pre odpoveď č. 1

librosa.power_to_db mali by ste to urobiť, pozrite sa na to