/ / Manipuler HTML à l'aide de mod_proxy avec Apache, par exemple. supprimer des annonces - apache, mod-proxy, man-in-the-middle, mod-proxy-html

Manipulation de HTML à l'aide de mod_proxy avec Apache, par exemple. supprimer des annonces - apache, mod-proxy, man-in-the-middle, mod-proxy-html

Pour le moment, il s’agit d’un défi technique, mais je voudrais fondamentalement procéder comme suit:

Créer un proxy inverse basé sur le Web (passerelle) à l'aide de mod_proxy et mod_proxy_html cela ne réécrit pas seulement les URL HTML pour correspondre au nom d’hôte du proxy, mais également réécrit ou manipule le HTML qui est traité par proxy.

Cette manipulation sur le proxy de la passerelle "homme au milieu" permettrait de faire toutes sortes de choses, telles que:

  • Supprimez la pub
  • traduire le texte d'une langue à une autre
  • autrement pirater ou "améliorer" le site d'origine

Bien sûr, cela pourrait potentiellement aussi être utilisé pour beaucoup de mauvaises choses, mais cela sort du cadre de cette question.

je le sais mod_proxy_html analyse le code HTML d'origine pour réécrire toutes les URL, mais me permet-il également d'écrire mon propre code qui évaluera et manipulera le code HTML en cours d'analyse? Ou existe-t-il d'autres modules pour cela?

Sinon, existe-t-il des procurations inverses disponibles qui peuvent le faire? Je suis prêt à m'adapter à toute langue qui convient à cette fin.

Réponses:

1 pour la réponse № 1

En utilisant mod_rewrite ou mod_proxy_html vous pourriez être capable de faire cela.

Comme vous le savez probablement déjà, ces modules vous permettent de réécrire / embellir les URL. Au lieu de modifier le contenu d'une page Web, qui n'est pas le rôle d'Apache, vous pouvez modifier leur structure ainsi un lien dans la page Web reçue ressemblerait à ceci:

10.10.1.1/my_secret_injector/alter?url=<the_real_url>

Au lieu de <the_real_url>.

Ensuite, implémentez votre algorithme de suppression des annonces ou autre dans la langue de votre choix sur le serveur Web indiqué. (10.10.1.1).