Mám index úložísk git a v každom dokumente ukladám názov úložiska, do ktorého súbor patrí. Formát poľa úložiska je {section}/{repo}
a je to pole TEXT. Chcem dosiahnuť dosť jednoduchú vec: zoznam všetkých archívov v indexe, t.j. - zoznam všetkých jedinečných hodnôt v - repo
lúka.
Keď používam
result = searcher.search(query.Every(), groupedby="repo")
for item in result.groups():
print(item)
hodnota sa vytlačí s hodnotami poľa rozdelenými na „/“, takže skutočne stratím {section}
časť repo hodnoty.
pridal som sortable=True
do repo poľa a celú vec znova indexovala. Teraz vracia správny formát repo hodnoty, ale iba jeden, keď očakávam, že to bude asi 10. Vidím, že _facetmaps
pole v objekte "result" má nesprávne hodnoty - chýbajú všetky repozitáre okrem jedného.
odpovede:
0 pre odpoveď č. 1Zdá sa, že súčasným riešením je použitie repo poľa ID searcher.lexicon("repo")
získate zoznam jedinečných hodnôt
https://bitbucket.org/mchaput/whoosh/issue/407/searched-with-groupedby-returns-incorrect