プログラミングの助け、質問への回答 / Python / BeautifulSoupのスクレーピング：混乱しています - python、beautifulsoup

BeautifulSoup擦り傷：私は混乱しています - python、beautifulsoup

私はこすり落とそうとしているこのサイトそして、私はすべてのアンカータグをチェックしたいです。

私はbeautifulsoup 4.3.2をインポートしました、そしてここに私のコードがあります：

url = """http://www.civicinfo.bc.ca/bids?pn=1"""
Html = urlopen(url).read()
Soup = BeautifulSoup(Html, "html.parser")
Content = Soup.find_all("a")

私の問題は、コンテンツが常に空であるということです（すなわち、Content = []）。誰かアイデアがありますか？

回答：

回答№1は2

からドキュメンテーション html.parser Pythonの特定のバージョンの前にそれほど寛容ではありません。だからあなたは「不正なHTMLを見ているでしょう」。

あなたがしたいことはあなたが使うならうまくいく lxml の代わりに html.parser

からドキュメンテーション：

とはいえ、スピードを上げるためにできることがあります美しいスープもし基礎となるパーサーとしてlxmlを使用していないのであれば、私のアドバイスから始めましょう。 Beautiful Soupはlxmlを使用するよりはるかに速くドキュメントを解析します html.parserまたはhtml5libを使用してください。

そのため、関連するコードは次のようになります。

Soup = BeautifulSoup(Html, "lxml")

関連する質問

python3＆beautifulsoup 4 - python、website、beautifulsoup、screen-scrapingを使ったウェブサイトのスクレイピング

美しいスープとテーブルスクレイピング - lxmlとhtmlパーサー - Python、Web-Scraping、HTML解析、Beautifulsoup、lxml

エスケープ＆hellip; BeautifulSoupで - python、エスケープ、beautifulsoup、web-scraping

MacOSX上のpython 3.6用のbeautifulsoup 4.6のインストールに関する問題、macos、python-2.7、python-3.x、beautifulsoup

BS4とBeautifulSoupのエラーから：/ var / mail / BeautifulSoupを読むことができません - python、beautifulsoup、bs4

リクエストによるGoogle特許のスクラップは、スタイルとスクリプトのタグのみを返す - Python、Web-Scraping、Beautifulsoup、Python-Request

Beautiful Soup pipインストールエラー - python、python-3.x、beautifulsoup

コードPythonのエラーBeautifulsoupはテキストとの特定のリンクを抽出します - python、url、beautifulsoup

Pythonを使用してWebページからIDとクラスを抽出する方法は？ - python、html、web-scraping

PythonでBeautifulsoupを加速するには？ - python、python-2.7、beautifulsoup

pythonのためのbeautifulsoupのインストールのための詳細な手順をメモ帳で使用する++ - python、beautifulsoup

Python BeautifulSoupがテーブルIDを見つけることができません - python、html、beautifulsoup

Pythonを使ったWebのスクラブの場合、lxmlの代わりにhtmlパーサを使うべきですか？どちらが良いの？ [閉じた] - Python、HTML、Webスクレイピング、HTML解析、lxml

PythonのWebサイトからのPDFのスクラップなぜそれらはすべて壊れていて、同じサイズですか？ - python、pdf、web-scraping、python-requests

Pythonでは、bs4を使用してWebサイトをスクラップして作成した5つのMS Word（.doc）ファイルの最初のxバイトを削除するにはどうすればよいですか？ - python、web-scraping、ms-word、beautifulsoup、bs4

Beautifulsoupはモジュールではありません - python、beautifulsoup

美しいスープ保存エンティティを使用したスクレイプ - python、web-scraping、beautifulsoup、html-parsing、html-entities

どのようにPythonを使用してHTMLからjavascriptをエクスポートする[閉じる] - python、web-scraping

beautifulsoupをpythonのために実行する方法 - python、beautifulsoup

美しいスープ3でPython Webを掻き集める：div-html、python-2.7、web-scraping、beautifulsoupからテキストを取得する方法