/ / wget "mirroring" pdf powiązane z inną domeną - javascript, regex, url, download, wget

wget "mirroring" pdf powiązane z inną domeną - javascript, regex, url, download, wget

Strona internetowa zawiera link do pliku pdf (zauważ różne domeny).

Mogę użyć wget do bezpośredniego pobrania pdf, alenie może zidentyfikować poprawnych opcji wiersza poleceń wget w celu "odzwierciedlenia" strony internetowej zawierającej ten połączony plik pdf. Próbowałem użyć kombinacji takich opcji jak

  • -p
  • --span-hosts
  • -RE
  • --zaakceptować

bez powodzenia.

Czy można pobrać wget (lub inne narzędzie wiersza poleceń), aby pobrać powiązane pliki pdf?

Podziękować

Odpowiedzi:

1 dla odpowiedzi № 1

Spróbuj parsować http://www.yowconference.com.au/brisbane/data/35.js. (Znalazłem ten URL za pomocą HttpFox.) Po sformatowaniu kodu (na przykład z http://jsbeautifier.org/) łatwo jest otworzyć adres URL plików pdf.


0 dla odpowiedzi nr 2

Chociaż link pdf jest wyświetlany w przeglądarkach, źródło strony nie zawiera łącza pobierania. Więc wget nie widzi / nie podąża za linkiem, ponieważ nie "naprawdę" przetwarza "stronę.