/ / Python whoosh - získa všetky jedinečné hodnoty z indexového poľa - python-3.x, whoosh

Python whoosh - získanie všetkých jedinečných hodnôt z indexového poľa - python-3.x, whoosh

Mám index úložísk git a v každom dokumente ukladám názov úložiska, do ktorého súbor patrí. Formát poľa úložiska je {section}/{repo} a je to pole TEXT. Chcem dosiahnuť dosť jednoduchú vec: zoznam všetkých archívov v indexe, t.j. - zoznam všetkých jedinečných hodnôt v - repo lúka.

Keď používam

result = searcher.search(query.Every(), groupedby="repo")
for item in result.groups():
print(item)

hodnota sa vytlačí s hodnotami poľa rozdelenými na „/“, takže skutočne stratím {section} časť repo hodnoty.

pridal som sortable=True do repo poľa a celú vec znova indexovala. Teraz vracia správny formát repo hodnoty, ale iba jeden, keď očakávam, že to bude asi 10. Vidím, že _facetmaps pole v objekte "result" má nesprávne hodnoty - chýbajú všetky repozitáre okrem jedného.

odpovede:

0 pre odpoveď č. 1

Zdá sa, že súčasným riešením je použitie repo poľa ID searcher.lexicon("repo") získate zoznam jedinečných hodnôt

https://bitbucket.org/mchaput/whoosh/issue/407/searched-with-groupedby-returns-incorrect