Strona internetowa zawiera link do pliku pdf (zauważ różne domeny).
Mogę użyć wget do bezpośredniego pobrania pdf, alenie może zidentyfikować poprawnych opcji wiersza poleceń wget w celu "odzwierciedlenia" strony internetowej zawierającej ten połączony plik pdf. Próbowałem użyć kombinacji takich opcji jak
- -p
- --span-hosts
- -RE
- --zaakceptować
bez powodzenia.
Czy można pobrać wget (lub inne narzędzie wiersza poleceń), aby pobrać powiązane pliki pdf?
Podziękować
Odpowiedzi:
1 dla odpowiedzi № 1Spróbuj parsować http://www.yowconference.com.au/brisbane/data/35.js. (Znalazłem ten URL za pomocą HttpFox.) Po sformatowaniu kodu (na przykład z http://jsbeautifier.org/) łatwo jest otworzyć adres URL plików pdf.
0 dla odpowiedzi nr 2
Chociaż link pdf jest wyświetlany w przeglądarkach, źródło strony nie zawiera łącza pobierania. Więc wget
nie widzi / nie podąża za linkiem, ponieważ nie "naprawdę" przetwarza "stronę.