/ / train sans modèle pour NER à l'openNLP - nlp, opennlp

train sans modèle pour NER à l'openNLP - nlp, opennlp

Je veux former un modèle pour extraire le nom d'une personne(partie du système NER) mais je veux que ce modèle soit sans casse (je veux dire que le modèle ne prendra pas en compte les lettres, aucune différence entre les lettres majuscules et minuscules), car j’ai un texte bruyant.

alors y a-t-il un paramètre dans l'étape d'entraînement pour faire cela, ou tout autre moyen?

Réponses:

2 pour la réponse № 1

Si vous devez utiliser OpenNLP, je suppose que vous pourriezformer de nouveaux modèles sur des données de formation sans cas. Prenez simplement les données de formation existantes disponibles (avec les annotations appropriées, etc.) et réduisez tout le contenu en minuscule avant de former un nouveau modèle.

Ou, si vous pouvez utiliser Stanford NER au lieu d’OpenNLP, vous pouvez simplement utiliser les modèles anglais préformés de Stanford NER: http://nlp.stanford.edu/software/CRF-NER.shtml#Models

Quel que soit votre choix, n'oubliez pas que votre précision diminuera si vous utilisez des modèles sans boîtier.