Ejemplo: cuando la url es http://www.google.com
Sé cómo obtener los contenidos y cómo analizarlos. file_get_contents
o curl
método.
Entonces, mi pregunta es: Cómo obtener los contenidos y analizar el archivo fuente de esa página web.
Por ejemplo: vista-fuente: http://www.google.com
Cuando trato de analizar el archivo fuente anterior, encontré que el contenido del archivo no se está cargando inicialmente para el análisis.
Así que necesito una ayuda con respecto,
Como cargar los contenidos de. view-source:http://www.google.com
página.
Respuestas
2 para la respuesta № 1file_get_contents
y view-source
en el navegador Chrome debería devolver lo mismo - el HTML Código de la página. Si está intentando obtener el código detrás de ese HTML (PHP, .net, etc ...), puede "t".
view-source
te está mostrando el exactamente lo mismo como el código, devuelto por cUrl
o file_get_contents
, y es una función solo en el navegador Chrome, no es un esquema de dirección URL válido.
2 para la respuesta № 2
Obtiene el contenido de la página web por file_get_contents ("http://www.google.com"); no file_get_contents ("view-source: http://www.google.com");
Luego lo analizas con:
$html = file_get_contents("http://www.google.com");
$doc = new DOMDocument();
$doc->loadHTML($html);
Si php DOM API no puede realizar el análisis, puede probar PHP HTML Simple DOM Parser. http://simplehtmldom.sourceforge.net/
2 para la respuesta № 3
Tu escribiste: "Por ejemplo: vista-fuente: http://www.google.com
Cuando intento analizar el archivo fuente anterior, encontré que el contenido del archivo no se está cargando "
Y aquí esta el problema: view-source:
Es una característica de Chrome, no una URL válida. Es por eso que los contenidos no se cargan. Las funciones php necesitan una url válida: http://www.google.com desde donde se puede cargar la fuente.