Ich arbeite gerade an einem Web-Crawler, und es scheint, dass ich die Klasse, die sich im Div befindet, von einer bestimmten Website nicht finden konnte. Unten ist mein Code. Ich benutze BeautifulSoup in Python3
import requests
from bs4 import BeautifulSoup as bs
response = requests.get("https://e27.co/startup/flipkart").text
soup = bs(response, "html.parser")
content_div = soup.findAll("h1",class_ = "profile-startup")
print(content_div)
Ich möchte den Text in der h1 extrahieren, der die Klasse "Profil-Startup" hat. Der obige Code gibt nichts zurück. Kannst du mir helfen?
Antworten:
0 für die Antwort № 1Diese Website füllt Daten mit Javascript. Wenn Sie sich den Inhalt in ansehen response
Sie werden sehen, dass es keine gibt h1
. Sie müssen prüfen, ob sie über eine API verfügen, mit der Sie die Informationen abrufen können, die Sie mithilfe einer Browser-Automatisierungstechnologie wie Selenium benötigen oder in Betracht ziehen: http://selenium-python.readthedocs.io/installation.html#introduction