プログラミングの助け、質問への回答 / Perl / HTMLから複数の結果を得る:: TreeBuilder - perl、html解析

HTML :: TreeBuilderから複数の結果を得る - perl、html-parsing

私はHTMLファイルを解析し、いくつかの情報を抽出し、それを統計することを試みています。

しかし、私の問題は、HTML :: TreeBuilderは1つの結果しか返さないということですが、Regexによってキャッチされるすべての結果が必要です。

#!/bin/perl
use strict;
use warnings;

use Data::Dumper;
use HTML::TreeBuilder;


my $tree = HTML::TreeBuilder->new();
$tree->parse_file("tester.html");
print Dumper($tree->look_down(_tag => "table",id => qr{post[0-9]*?})->as_HTML);
$tree->delete;

tester.html：

<table id="post923076">
<tr>
<td>table1_result</td>
</tr>
</table>
<table id="post923076">
<tr>
<td>table2_result</td>
</tr>
</table>

私の結果：

$VAR1 = "<table id="post923076"><tr><td>table1_result</td></tr></table>";

誰かが考え？

ファイルはこのテーブルの多くを含む可能性があるので、私は例えばファイルを短くしました。

回答：

回答№1の11

スカラコンテキストでは、の最初の結果 look_down 返されます。

連鎖の結果としてスカラコンテキストで使用している look_down->as_HTML.

リストコンテキストで呼び出してから使う map 各要素をHTMLに変換します。

print Dumper(map { $_->as_HTML } $tree->look_down(_tag => "table", id => qr{post[0-9]*?}));

Perlで失敗する正規表現を使用すると、1行の正規表現を見つけて置換する - regex、perl

Perl grep-regex、perl、grepを使って、段落から一致する文字列を含む行の一部を取得する

Symfony2のTreeBuilderは検証配列を設定します - php、symfony

大規模なhtmlファイル（ローカル）の解析 - PerlまたはPHP - php、perl、テキスト解析

STDINからファイルを読み込み、STDOUTに書き込む - perl、file

perlのネットワークチュートリアル[閉鎖] - perl、web-applications

Perl HTMLパーサ - perl、web-scraping

perlを使って複数テーブルのhtmlファイルから特定のテーブルを抽出する[閉じる] - perl、html-parsing、extract

ファイルが正しく機能しない - perl、csv

ディレクトリを読み込んでファイルの内容をPerl - perl、file、parsingの新しいファイルに保存する

単純なJSON配列をPerlで解析する[複製] - json、perl、perl-data-structures

SVGのパスと変換 - javascript、svg

HTML-TreeBuilder-XPath findnodes（）メソッド - html、xml、perl、xpath、html-treebuilderを使用して、マッチした結果を1つずつ印刷する際の提案が必要

Perlで<div class =“ foo”>と</div>を簡単に解析する方法 - html、perl、解析

Perlを使用して、divタグ内のHTMLを抽出してフォーマットする - html、perl

perl look_downタグindex - html、perl

Perl：HTML要素をIDで変更する - html、perl

Perlのクラスに基づいていくつかのHTMLタグを置き換えるにはどうすればよいですか？ - html、perl

これはどんなタイプのPerlですか？ - html、perl、tags

HTML :: TreeBuilderから複数の結果を得る - perl、html-parsing

回答：

関連する質問