Jestem nowy w Tika i pracuję nad analizowaniem plików programu Outlook. Za pomocą programu Outlook Extractor mogę analizować Plik * .msg, ale nie * .pst. Czy można parsować plik pst za pomocą tika? Jeśli tak jak?
Dzięki
Odpowiedzi:
1 dla odpowiedzi № 1W momencie, gdy zadałeś pytanie, nie było to możliwe Wniosek o ulepszenie Tika - TIKA-623 dodawanie obsługi PST zostało rozwiązane tylko w Tika1.6 W przypadku starszych wersji Tiki należy pobrać łatkę stamtąd. (Wszystkie zależności są teraz w Maven Central - to był kluczowy bloker przez długi czas)
Dla użytkowników Apache Tika 1.6 lub nowszej dobrą wiadomością jest to, że wbudowana jest obsługa PST, oraz PST jest teraz jednym z obsługiwanych formatów poczty w Tika!
0 dla odpowiedzi nr 2
Parser plików pst jest dostępny z Tika 1.6
https://tika.apache.org/1.6/api/org/apache/tika/parser/mbox/OutlookPSTParser.html
Pobierz najnowszy słoik z http://grepcode.com/project/repo1.maven.org/maven2/org.apache.tika/tika-app/