/ / Як можна витягнути та відформатувати HTML, знайдений у тезі div, за допомогою Perl? - html, perl

Як я можу витягувати та відформатувати HTML, знайдені в тезі div, використовуючи Perl? - html, perl

Примітка:

  • Використовуючи HTML :: TreeBuilder або інший відповідний спосіб

Питання:

  • Використання Perl с LWP, для наступного HTML, як це зробити пошук для буквального рядка що завгодно між початковим тегом і кінцевим тегом div і потім отримати весь текст між вищезазначеним початковим і кінцевим тегами, поки прилипання до форматування текстових тегів

    <div id="foo" class="blah">
    <tt>
    test
    <br>test
    <br>whatever
    <br>test
    </div>
    

Щоб надрукувати в STDOUT:

test
test
whatever
test

Відповіді:

2 для відповіді № 1
my @elms = $tree->look_down(
_tag => "div",
sub { $_[0]->as_text =~ /whatever/ },
);

for my $elm (@elms) {
print $elm->as_trimmed_text;
}

4 для відповіді № 2
$node->find_by_attribute(attribute, value) and $node->as_text()

http://lwp.interglacial.com/ch09_03.htm