/ / Como criar um conjunto de dados de transição (baseado em árvore) para a análise de sentimentos de Stanford Core NLP a partir do conjunto de dados de sentimentos brutos dos comentários do blog? - Stanford-PNL, análise de sentimentos

Como criar um conjunto de dados de traninging (baseado em árvore) para a análise de sentimento nlp do núcleo de stanford a partir do conjunto de dados de comentários dos comentários do blog? - stanford-nlp, análise de sentimentos

Tenho um conjunto de comentários de blog, como faço para criar os dados de treinamento para o modelo profundo recursivo?

Como os dados de amostra

(4 (4 (2 A) (4 (3 (3 quente) (2,)) (3 engraçado))) (3 (2,) (3 (4 (4 envolvente) (2 filme)) (2.) )))

Respostas:

0 para resposta № 1

Como você mostra, o modelo de sentimento da RNN requer um conjunto de treinamento de linguagem analisada rotulado com dados de sentimento em cada nó da árvore.

Você precisa faça você mesmo essas anotações (ou seja, manualmente) para garantir a qualidade do analisador. Existem alguns detalhes em o papel original sobre como os dados de treinamento foram criados pelo crowdsourcing. Com motivação, tempo e dinheiro suficientes, você pode fazer o mesmo.


Uma alternativa menor seria primeiro use o analisador padrão e o modelo de sentimento para rotular automaticamente os dados, corrija manualmente os erros de análise e sentimento. Isso pode ser sustentável se o domínio de texto com o qual você estiver trabalhando for semelhante ao usado para treinar o modelo. Como você está trabalhando com comentários no blog, infelizmente esse não é o caso!