/ / Correspondência de texto e áudio falado - linux, áudio, reconhecimento de voz

Correspondência de texto e áudio falado - linux, áudio, reconhecimento de voz

Eu tenho alguns textos em chinês e clipes de áudio dealguém lendo o mesmo texto. Usando algum software, eu dividi a gravação em locais importantes (sempre que o alto-falante descansava), por isso tenho muitos arquivos de áudio individuais. No texto, gostaria de marcar todos os lugares em que ocorre uma divisão no arquivo de áudio (por exemplo, coloque um "@" no local em que um arquivo de áudio termina e o próximo começa).

  • Não há ruídos de fundo e apenas em alguns lugares raros o texto e a voz diferem.
  • O texto tem centenas de páginas e dez mil arquivos de áudio; portanto, levaria uma eternidade para fazer isso manualmente.

Como posso marcar ou dividir o texto para corresponder às divisões nos arquivos de áudio?

Respostas:

1 para resposta № 1

Por que você não verifica o julius search engine? Mas precisa de treinamento.