例:URLが http://www.google.com
私は知っている、内容を取得する方法とそれによってそれを解析する方法 file_get_contents
または curl
方法。
だから、私の質問は: そのWebページの内容を取得してソースファイルを解析する方法。
例:view-source: http://www.google.com
上記のソースファイルを解析しようとしているときに、解析のためにファイルの内容が最初に読み込まれていないことがわかりました。
だから私はについての助けが必要です、
の内容を読み込む方法 view-source:http://www.google.com
ページ。
回答:
回答№1は2file_get_contents
そして view-source
クロムブラウザで同じことを返す必要があります - HTML ページのコードそのHTMLの背後にあるコード(PHP、.netなど)を手に入れようとしているのであれば、それは不可能です。
view-source
あなたに まったく同じこと コードとしては、 cUrl
または file_get_contents
これはChromeブラウザの機能のみです。有効なURLアドレススキームではありません。
回答№2については2
あなたはfile_get_contents( "http://www.google.com")によってウェブページコンテンツを得ます。 not file_get_contents( "ビューソース: http://www.google.com");
それからあなたはそれを次のように構文解析します。
$html = file_get_contents("http://www.google.com");
$doc = new DOMDocument();
$doc->loadHTML($html);
php DOM APIがパースできない場合は、PHP Simple HTML DOM Parserを試すことができます。 http://simplehtmldom.sourceforge.net/
答え№3の2
あなたが書いた: "例:view-source: http://www.google.com
上記のソースファイルを解析しようとしたところ、ファイルの内容が読み込まれていないことがわかりました
そしてここに問題があります: view-source:
chromeの機能です - 有効なURLではありません。これが「コンテンツがロードされない理由」です。 php関数は有効なURLを必要とします。 http://www.google.com そこからソースをロードできます。