Tenho um conjunto de comentários de blog, como faço para criar os dados de treinamento para o modelo profundo recursivo?
Como os dados de amostra
(4 (4 (2 A) (4 (3 (3 quente) (2,)) (3 engraçado))) (3 (2,) (3 (4 (4 envolvente) (2 filme)) (2.) )))
Respostas:
0 para resposta № 1Como você mostra, o modelo de sentimento da RNN requer um conjunto de treinamento de linguagem analisada rotulado com dados de sentimento em cada nó da árvore.
Você precisa faça você mesmo essas anotações (ou seja, manualmente) para garantir a qualidade do analisador. Existem alguns detalhes em o papel original sobre como os dados de treinamento foram criados pelo crowdsourcing. Com motivação, tempo e dinheiro suficientes, você pode fazer o mesmo.
Uma alternativa menor seria primeiro use o analisador padrão e o modelo de sentimento para rotular automaticamente os dados, corrija manualmente os erros de análise e sentimento. Isso pode ser sustentável se o domínio de texto com o qual você estiver trabalhando for semelhante ao usado para treinar o modelo. Como você está trabalhando com comentários no blog, infelizmente esse não é o caso!