/ / Raclage d’écran Java, comment obtenir une réponse à partir d’une demande de post-redirection - java, grattage d’écran, jsoup

Écran Java, comment obtenir une réponse à partir de la demande de redirection - java, screen-scraping, jsoup

Je viens d'expérimenter sur la chose d'extraction de donnéesavec java, recherchez dans ce forum et constatez qu'il s'appelait grattage d'écran. J'ai cherché une bibliothèque de grattoirs d'écran pour Java et j'ai trouvé JSoup pour analyser le résultat.

Mon problème est le site cible en utilisant postLorsque le formulaire de recherche est soumis, il n’est pas facile de le reproduire. Je vérifie également, avec les outils de développement en chrome, que le code de réponse après la soumission est 302, puis redirige vers une page, puis redirige vers la page de résultats.

S'il vous plaît, donnez-moi un indice ou dirigez-moi vers un tutoriel pour savoir comment le faire avec jsoup. dans mon cas, j'essaie de récupérer les horaires de vol de ai * ras * ia. * com

Réponses:

0 pour la réponse № 1

Dans JSOUP, il existe une fonction appelée .followRedirects (followRedirects) qui vous donne l'option si vous souhaitez suivre les redirections ou non par défaut, elle est définie sur "true".

et c’est le code HTTP pour lequel il autorise les redirections:

  • 301 - HTTP_MOVED_PERM
  • 302 - HTTP_MOVED_TEMP
  • 303 - HTTP_SEE_OTHER