/ /任意のソースファイルの内容を取得する方法[クローズ] - php、parsing、curl

任意のソースファイルの内容を取得する方法[閉じる] - php、parsing、curl

例:URLが http://www.google.com

私は知っている、内容を取得する方法とそれによってそれを解析する方法 file_get_contents または curl 方法。

だから、私の質問は: そのWebページの内容を取得してソースファイルを解析する方法。

例:view-source: http://www.google.com

上記のソースファイルを解析しようとしているときに、解析のためにファイルの内容が最初に読み込まれていないことがわかりました。

だから私はについての助けが必要です、

の内容を読み込む方法 view-source:http://www.google.com ページ。

回答:

回答№1は2

file_get_contents そして view-source クロムブラウザで同じことを返す必要があります - HTML ページのコードそのHTMLの背後にあるコード(PHP、.netなど)を手に入れようとしているのであれば、それは不可能です。

view-source あなたに まったく同じこと コードとしては、 cUrl または file_get_contentsこれはChromeブラウザの機能のみです。有効なURLアドレススキームではありません。


回答№2については2

あなたはfile_get_contents( "http://www.google.com")によってウェブページコンテンツを得ます。 not file_get_contents( "ビューソース: http://www.google.com");

それからあなたはそれを次のように構文解析します。

$html = file_get_contents("http://www.google.com");
$doc = new DOMDocument();
$doc->loadHTML($html);

php DOM APIがパースできない場合は、PHP Simple HTML DOM Parserを試すことができます。 http://simplehtmldom.sourceforge.net/


答え№3の2

あなたが書いた: "例:view-source: http://www.google.com

上記のソースファイルを解析しようとしたところ、ファイルの内容が読み込まれていないことがわかりました

そしてここに問題があります: view-source: chromeの機能です - 有効なURLではありません。これが「コンテンツがロードされない理由」です。 php関数は有効なURLを必要とします。 http://www.google.com そこからソースをロードできます。