私はドイツ語で書かれたテキストの感情を分析したい。私は英語でこれを行う方法に関するチュートリアルをたくさん見つけましたが、それをさまざまな言語に適用する方法については何も見つかりませんでした。
私は、 TextBlob
Pythonライブラリを使用して最初にセンテンスを英語に翻訳してからセンチメント分析を行いますが、このタスクを解決する最善の方法であるかどうかはわかりません。
あるいは、このタスクを解決する他の方法がありますか?
回答:
回答№1は2Andyが上記のように指摘したように、最良のアプローチは独自の分類子を訓練することです。別の、より迅速かつ汚れたアプローチは、ドイツの感情辞典 SentiWS、単純に文の極性を計算するその個々の単語の極性値に基づいて(例えばそれらを合計することによって)決定する。この方法は絶対に不可能ではありませんが(例えば、否定的な意味合いは考慮しませんが)、比較的迅速に合理的な結果を得られます。
回答№2の場合は0
あるいは、分類の代わりに、ドイツの主観的な用語の感想辞書を使うこともできます。この論文を読むことは有益だろう[1]。レキシコンベースのモデルを使用する利点は、トレーニングを必要としないことです。
それを行うもう1つの方法は、クラシファイア内の用語をクラシファイア自体のフィーチャとして、手動で注釈付きのトレーニングセットとともにフィードすることを含むハイブリッドモデルを試すことです。