Допомога у програмуванні, відповіді на питання / Python / Красивий суп, що повертається небажаними персонажами - пітон, красивий суп, пітон-унікод

Прекрасний суп, що повертається небажаним персонажам - пітон, красивийсуп, пітон-юнікод

Я використовую Beautiful Soup для обрізання сторінок, намагаючись досягти висоти певних спортсменів:

req = requests.get(url)
soup = BeautifulSoup(req.text, "html.parser")
height = soup.find_all("strong")
height = height[2].contents
print height

На жаль, це те, що повертається:

[u "6" 0 ""]

Я також намагався:

height = str(height[2].contents)

height = unicode(height[2].contents)

але я все одно отримую [u "6" 0 ""] як результат.

Як мені просто повернути 6 "0" без зайвих символів? Спасибі за вашу допомогу!

Відповіді:

0 для відповіді № 1

Це не "т" зайві символи ". .contents повертає список, у вибраному вами елементі є лише одна дочірка, і тому ви отримуєте список, що містить один елемент. Python друкує список як псевдо код Python, щоб ви могли побачити, що це таке і що в ньому.

Можливо, ви хочете .string?

0 для відповіді № 2

Якщо ви хочете лише третього сильний тег, що вам не потрібно всіх шукати, ви можете використовувати селектор css nth-of-type, як тільки у вас є елемент, який вам просто потрібно зателефонувати .text:

req = requests.get(url)
soup = BeautifulSoup(req.content, "html.parser")
height = soup.select_one("strong:nth-of-type(3)").text

print(height)

Ви також повинні телефонувати .content, дозволяючи запитам обробляти кодування.

Схожі запитання

Beautfiul Soup 3: перетворення двобайтових послідовностей Unicode на фактичні символи Unicode - python, unicode, кодування, utf-8, beautifulsoup

Як я можу отримувати простий текст з класу HTML за допомогою URL-адреси в python? - python, html

проблеми з встановленням / використанням Beautiful Soup 4 - python, beautifulsoup

Як використовувати multipleath findAll у python3? - python, python-3.x, beautifulsoup, веб-сканер

Втеча & hellip; з BeautifulSoup - пітон, втеча, красивий суп, веб-скребком

BeautifulSoup скребком: я плутаю - пітон, красивий суп

Помилка встановлення прекрасної супової піпи - python, python-3.x, beautifulsoup

Як видалити тег HTML, який містить пробіл, лише за допомогою BeautifulSoup та Python - python, html, beautifulsoup

Проблеми з Urllib2 / прекрасний суп не скребком - python, beautifulsoup, urllib2

отримати конкретне зображення з посиланням на сайт з beautifulSoup - python, beautifulsoup

Красивий суп на героку? - python, django, heroku, beautifulsoup, virtualenv

Функція бібліотеки Bash Python - Використання красивого супу в оболонці для HTML-тексту - python, html, bash, shell, plaintext

Я спробував запустити програму python на терміналі mac, але продовжую отримувати відгуки нижче, коли я успішно встановив Beautifulsoup4 - python, macos, terminal, beautifulsoup

Чому Beautifulsoup буде повертати NoneTypes, якщо годувати механізувати відповідь? - пітон, красивий суп, механізувати

python-nvd3 два та більше графіків на сторінці - python, d3.js, beautifulsoup, nvd3.js

Як отримати посилання CSS з використанням Beautiful Soup [дублікат] - python, regex, python-3.x, beautifulsoup

Скребти, використовуючи красиві супи консервування - python, web-scrapping, beautifulsoup, html-parsing, html-entities

Сумісність з Python 3 BeautifulSoup - python, python-3.x, beautifulsoup, porting

Як очистити P-теги за допомогою красивого супу - python, web-scrapping, beautifulsoup, tags

Python Web зламаний з красивим супом 3: як отримати текст з div-html, python-2.7, веб-скребком, beautifulsoup