Aide à la programmation, réponses aux questions / Python / BeautifulSoup extrait des données dans un div de divs - Python, HTML, Web-scraping, beautifulsoup, linkedin

BeautifulSoup extraire des données dans un div de divs - python, html, scraping web, beautifulsoup, linkedin

Je veux extraire des données d'un ul et ce ul est à l'intérieur div et ainsi de suite. Je l'ai fait avec LXML mais maintenant je veux l'essayer avec une belle soupe

import requests
from bs4 import BeautifulSoup

headers = {"User-Agent": "Mozilla/5.0"}

url = "https://linkedin.com/company/1005"

r = requests.get(url, headers=headers)
print(r.text)

soup = BeautifulSoup(r.text, "html.parser")

div = soup.find_all("div", class_="basic-info-description")
print div

Réponses:

2 pour la réponse № 1

Essayer:

for ana in soup.findAll("ul"):
if ana.parent.name == "div":
#ana is the ul with a div parent

1 pour la réponse № 2

Vous pouvez simplement utiliser à nouveau find (All) sur les objets bs que vous avez trouvés, comme:

ul = soup.findAll("div", attrs={"class":"basic-info-about"}).find("ul")

L'inconvénient du code ci-dessus est qu'il génère une erreur si la première div n'est pas dans le code HTML. Mieux serait:

divs = soup.findAll(""div", attrs={"class":"basic-info-about"}")
for div in divs:
ul = div.find("ul")

questions connexes

Belle soupe et grattage de table - analyseur lxml vs html - python, déchiquetage Web, analyse html, beautifulsoup, lxml

Échapper & hellip; avec BeautifulSoup - python, s'échapper, beautifulsoup, web-scraping

BeautifulSoup raclant: Je suis confus - python, beautifulsoup

Comment accéder à l'identifiant d'une div avec BeautifulSoup? - python, beautifulsoup, analyse HTML

Écran Python gratter tout le site - python, html, grattage d'écran, beautifulsoup

Erreur avec le code Python Beautifulsoup extraire un lien spécifique avec du texte - python, url, beautifulsoup

Extraire div externe avec BeautifulSoup - python, beautifulsoup

Comment extraire les identifiants et les classes d'une page Web à l'aide de python? - python, html, web-scraping

Comment accélérer Beautifulsoup en Python? - python, python-2.7, beau groupe

Impossible de charger le contenu d'un iframe avec Python - python, python-3.x, iframe, Web-scraping, beautifulsoup

Trouver le nombre de divs avec un certain identifiant dans BeautifulSoup? - python, magnifique

Comment utiliser python-request pour récupérer une page linkedin? - python, linkedin, python-request

donne les étapes détaillées pour l'installation de beautifulsoup pour python à utiliser dans le bloc-notes ++ - python, beautifulsoup

Python BeautifulSoup ne peut pas trouver l'ID de table - python, html, beautifulsoup

Pour le Web grattant en python, quand devrais-je utiliser un analyseur HTML au lieu de lxml? Quel est le meilleur et pourquoi? [fermé] - Python, HTML, Web-scraping, HTML-Parsing, LXML

Python belle toile de grattage grattage - python, html, beautifulsoup

Beautifulsoup n'est pas un module - python, beautifulsoup

extraire des valeurs dans des données HTML - python, html, regex

Comment exporter du javascript à partir de HTML à l'aide de python [fermé]

Python Web scraping avec Beautiful Soup 3: comment obtenir du texte de div - html, python-2.7, web-scraping, beautifulsoup