/ / ¿Cómo puedo extraer y formatear el código HTML encontrado en una etiqueta div, usando Perl? - html, perl

¿Cómo puedo extraer y formatear HTML encontrado en una etiqueta div, usando Perl? - html, perl

Nota:

Pregunta:

  • Usando Perl con LWP, para el siguiente HTML, como buscar para la cadena literal lo que sea entre la etiqueta inicial y la etiqueta final div y entonces obtener todo el texto entre las etiquetas de inicio y finalización antes mencionadas, mientras que adherido formatear etiquetas de texto

    <div id="foo" class="blah">
    <tt>
    test
    <br>test
    <br>whatever
    <br>test
    </div>
    

Para imprimir a STDOUT:

test
test
whatever
test

Respuestas

2 para la respuesta № 1
my @elms = $tree->look_down(
_tag => "div",
sub { $_[0]->as_text =~ /whatever/ },
);

for my $elm (@elms) {
print $elm->as_trimmed_text;
}

4 para la respuesta № 2
$node->find_by_attribute(attribute, value) and $node->as_text()

http://lwp.interglacial.com/ch09_03.htm