čítal som tento papier o environmentálnej hlukovej diskriminácii pomocou. \ tConvolution Neural Networks a chceli reprodukovať svoje výsledky. Konvertujú WAV súbory do log-škálovaných mel spektrogramov. Ako to robíte? Som schopný previesť WAV súbor na mel spektrogram
y, sr = librosa.load("audio/100263-2-0-117.wav",duration=3)
ps = librosa.feature.melspectrogram(y=y, sr=sr)
librosa.display.specshow(ps, y_axis="mel", x_axis="time")
Som tiež schopný zobraziť ako logaritmický spektrogram:
librosa.display.specshow(ps, y_axis="log", x_axis="time")
Je zrejmé, že vyzerajú inak, ale skutočný spektrogram ps
je rovnaký. Používanie librosa, Ako môžem previesť tento melspectrogram do logaritmicky zmeneného melspectrogramu? Okrem toho, čo je použitie logaritmického spektrogramu oproti originálu? Je to len zníženie rozptylu domény frekvencie, aby bolo porovnateľné s časovou osou, alebo niečo iné?
odpovede:
0 pre odpoveď č. 1librosa.power_to_db
mali by ste to urobiť, pozrite sa na to