/ / Cómo obtener el contenido de un archivo de cualquier fuente [cerrado] - php, análisis, curl

Cómo obtener el contenido de un archivo de cualquier fuente [cerrado] - php, análisis, curl

Ejemplo: cuando la url es http://www.google.com

Sé cómo obtener los contenidos y cómo analizarlos. file_get_contents o curl método.

Entonces, mi pregunta es: Cómo obtener los contenidos y analizar el archivo fuente de esa página web.

Por ejemplo: vista-fuente: http://www.google.com

Cuando trato de analizar el archivo fuente anterior, encontré que el contenido del archivo no se está cargando inicialmente para el análisis.

Así que necesito una ayuda con respecto,

Como cargar los contenidos de. view-source:http://www.google.com página.

Respuestas

2 para la respuesta № 1

file_get_contents y view-source en el navegador Chrome debería devolver lo mismo - el HTML Código de la página. Si está intentando obtener el código detrás de ese HTML (PHP, .net, etc ...), puede "t".

view-source te está mostrando el exactamente lo mismo como el código, devuelto por cUrl o file_get_contents, y es una función solo en el navegador Chrome, no es un esquema de dirección URL válido.


2 para la respuesta № 2

Obtiene el contenido de la página web por file_get_contents ("http://www.google.com"); no file_get_contents ("view-source: http://www.google.com");

Luego lo analizas con:

$html = file_get_contents("http://www.google.com");
$doc = new DOMDocument();
$doc->loadHTML($html);

Si php DOM API no puede realizar el análisis, puede probar PHP HTML Simple DOM Parser. http://simplehtmldom.sourceforge.net/


2 para la respuesta № 3

Tu escribiste: "Por ejemplo: vista-fuente: http://www.google.com

Cuando intento analizar el archivo fuente anterior, encontré que el contenido del archivo no se está cargando "

Y aquí esta el problema: view-source: Es una característica de Chrome, no una URL válida. Es por eso que los contenidos no se cargan. Las funciones php necesitan una url válida: http://www.google.com desde donde se puede cargar la fuente.