/ / Jak mogę wykluczyć duże pliki podczas indeksowania? - indeksowanie, solr, robota sieciowego

Jak mogę wykluczyć duże pliki podczas indeksowania? - indeksowanie, solr, robota sieciowego

Czy istnieje sposób na skonfigurowanie Solr do ignorowania dużych plików podczas indeksowania?

Próbuję zindeksować dysk sieciowy, ale nie mogę zrozumieć, jak zignorować duże pliki (> 20 MB).

Dzięki

Odpowiedzi:

1 dla odpowiedzi № 1

Spróbuj czegoś podobnego:

$ find / mnt-typ-f-size -20M -exec / opt / solr / bin / post -c wizbang {};

Jeśli używasz Tika, ma limit rozmiaru pliku, ale nie "ignoruje" pliku:

Apache Tika i limit znaków podczas analizowania dokumentów

Jak czytać duże pliki za pomocą TIka?