Pomoc pri programovaní, odpovede na otázky / Stanford nlp / Vytrhávanie nejakého textu pomocou stanford-nlp - stanford-nlp

Chunking nejaký text s stanford-nlp-stanford-nlp

Používam stanfordské jadro NLP a pomocou tohto riadku načítam niektoré moduly na spracovanie textu:

props.put("annotators", "tokenize, ssplit, pos, lemma, ner, parse, dcoref");

Existuje modul, ktorý môžem načítať, aby roztrhol text?

Alebo nejaký návrh s alternatívnym spôsobom, ako využiť stanfordské jadro na zničenie nejakého textu?

Ďakujem

odpovede:

5 pre odpoveď č. 1

Myslím, že výstup syntaktického analyzátora sa dá použiť na získanie blokov NP. Pozrite sa na bezkonkurenčné zastúpenie na internete Web Stanford Parser ktorý poskytuje vzorový výstup.

5 pre odpoveď № 2

Na použitie chunkingu so Stanford NLP môžete použiť nasledujúce balíčky:

YamCha: NP-chunker na báze SVM, použiteľný aj na označovanie POS, NER atď. C / C ++ open source. Vyhral CoNLL 2000 zdieľanú úlohu. (Menej automatické ako špecializované POS značkovače pre koncového používateľa.)
Phrase Chunker od Mark Greenwood: Reimplementácia jazyka Java z Ramshaw a Marcus (1995).
fnTBL: Rýchla a flexibilná implementácia vzdelávania založeného na transformácii v C ++. Zahŕňa POS značkovače, ale aj NP chunking a všeobecné chunking modely.

zdroj: http://www-nlp.stanford.edu/links/statnlp.html#NPchunk

Súvisiace otázky

Transformácia XML na použitie ako tréningová množina pre Rozpoznávanie identifikovaných entít (NER) - xml, nlp, stanford-nlp, pomenovanie entity-name, crf

Nekonzistencie v tokeningu veľkých anglických súborov pomocou nástroja StanBort PTBTokenizer? - tokenize, stanford-nlp

V CoreNLP, čo je odlišné medzi štandardne generovanými stromami závislostí? - stanford-nlp

Ako klasifikovať dokumenty pomocou štandardného NLP - stanford-nlp

Stanford CoreNLP NER tréning zamrzne - stanford-nlp, pomenovanie-uznanie entity

Ako spustiť stanford corenlp? - stanford-nlp

Vyberte jazykový model CoreNLP za behu - stanford-nlp

Stanford NLP: Ako sa dostať kúsky - python, regex, nltk, stanford-nlp

Stanford CoreNLP napríklad na Arabský jazyk - nlp, stanford nlp, arabčina

NoClassDefFoundError pre Stanfordskú NLP knižnicu - java, ant, stanford-nlp, websphere-freedom, ibm-cloud

Stanford klasifikátorov vs Weka klasifikátorov - java, nlp, klasifikácia, weka, stanford-nlp

ako extrahovať iba frázy podstatných slov z vety pomocou stanford nlp v java? - java, stanford-nlp

Interpretácia výstupu Coreprel CoreNLP Coreference Resolution - java, nlp, stanford-nlp

Nainštalujte StanNord CoreNLP pomocou závislostí Maven: get - java, maven, nlp

Spustenie štandardného klasifikátora NER v režime servera - java, sockets, client-server, nlp, stanford-nlp

Stanford NLP sentiment bežiaca chyba - java, stanford-nlp

Aké sú všetky jarové súbory, ktoré by som mal zahrnúť, aby som použil stanfordský analyzátor v mojom projekte? - java, parsovanie, nlp, stanford-nlp

Vydanie pomocou modelov parsovania StanNord CoreNLP - java, parsing, stanford-nlp

Karel obrazovka je prázdna pri pokuse o spustenie v Eclipse na Mac - java, karel

kde sa môžem naučiť prepojený zoznam / stohy? [closed] - c, linked-list, stack