Pomoc w programowaniu, odpowiedzi na pytania / JavaScript / wget "mirroring" pdf powiązane z inną domeną - javascript, regex, url, download, wget

wget "mirroring" pdf powiązane z inną domeną - javascript, regex, url, download, wget

Strona internetowa zawiera link do pliku pdf (zauważ różne domeny).

Mogę użyć wget do bezpośredniego pobrania pdf, alenie może zidentyfikować poprawnych opcji wiersza poleceń wget w celu "odzwierciedlenia" strony internetowej zawierającej ten połączony plik pdf. Próbowałem użyć kombinacji takich opcji jak

-p
--span-hosts
-RE
--zaakceptować

bez powodzenia.

Czy można pobrać wget (lub inne narzędzie wiersza poleceń), aby pobrać powiązane pliki pdf?

Podziękować

Odpowiedzi:

1 dla odpowiedzi № 1

Spróbuj parsować http://www.yowconference.com.au/brisbane/data/35.js. (Znalazłem ten URL za pomocą HttpFox.) Po sformatowaniu kodu (na przykład z http://jsbeautifier.org/) łatwo jest otworzyć adres URL plików pdf.

0 dla odpowiedzi nr 2

Chociaż link pdf jest wyświetlany w przeglądarkach, źródło strony nie zawiera łącza pobierania. Więc wget nie widzi / nie podąża za linkiem, ponieważ nie "naprawdę" przetwarza "stronę.

Powiązane pytania

xcode.xip i menedżer pobierania nie działają Ubuntu - xcode, ubuntu, download-manager

Co to jest wget i jak uzyskać obrazy z katalogu publicznego? [zamknięty] - windows, linux, bash, shell, wget

Pętla na wiele numerów do pobrania za pomocą wget - while-loop, sh, wget

wget -k -p -r exampleserver.com nie pobiera obrazów? - wget

Jak wyświetlić kod źródłowy wget? - wget, gz

wget: jak przeszukiwać adresy URL z postacią sklepu (#) - wget, robota sieciowego

Regex z wget? - wget

za pomocą wget pobrać wszystkie dane ze strony - wget

Jak korzystać z Wget, aby pobrać poprawny rozmiar obrazu z rozszerzeniem ".jpg? Size = 2000" - wget, imagedownload

wget z dzikimi postaciami [* .cpp] - wget

wget określony folder z innej subdomeny do oryginalnego łącza - wget

Tworzenie kopii zapasowej witryny wraz z plikami za pomocą wget - web, wget

Jak pobrać plik z adresu URL http? - url, unix, download, wget

plik download.file w R zawierający wstępne wymagania - r, wget

Dublowanie za pomocą wyrażenia regularnego w wget - regex, wget

Pozwól Wget pobierać tylko pliki aplikacji typu PDF - linux, unix, web-crawler, wget

W jaki sposób powiedzieć wget, aby pobierał tylko pliki w określonej ścieżce - linux, wget

Powiedz wget, aby pobrać tylko najnowszy plik z katalogu? - linux, ftp, wget

Wildcard on wget to http download ostatnia wersja - http, download, version, wildcard, wget

Pobierz plik CSV w powłoce bash - bash, shell, wget