Помощ при програмиране, отговори на въпроси / нето / .Net Regex за извличане на текст - .net, regex

.Net Regex за извличане на текст - .net, regex

Здравейте имам много html файлове и трябва да извлека някаква информация от нея, например, за да извлечете номера на модела на устройството, използвам кода на регекс по-долу:

string sFullString = "Device:</span> <span id="model-value" category="model">DXE-9880</span></li>";
string sStart = "category="model">";
string sEnd = "<";
Regex regex = new Regex("(?<=" + Regex.Escape(sStart) + @").*(?=" + Regex.Escape(sEnd) + @")", RegexOptions.IgnoreCase);

Match match = regex.Match(sFullString);
if (match.Success)
{
Console.WriteLine(match.Value);
}

Очакваният резултат ще бъде "DXE-9880", но той винаги е "DXE-9880". Защо втората "<" е взета след номера на модела, а не първата?

Отговори:

1 за отговор № 1

Просто правете междубанковете .* да се .*? защото .* е алчен, който съвпада с всички знаци колкото е възможно повече.

Regex regex = new Regex("(?<=" + Regex.Escape(sStart) + @").*?(?=" + Regex.Escape(sEnd) + @")", RegexOptions.IgnoreCase);

ИЛИ

Използвайте класа с отрицателна характеристика.

Regex regex = new Regex("(?<=" + Regex.Escape(sStart) + @")[^<>]*(?=" + Regex.Escape(sEnd) + @")", RegexOptions.IgnoreCase);

[^<>]* съответства на всеки знак, но не на < или >, нула или повече пъти.

Свързани въпроси

PHP Регулярен израз - не работи .. трябва да бъде - regex, дата

Многобройна селекция с регекс (възвишен текст 2) - regex, sublimetext2

RegEx шаблон за извличане на URL адреси - regex, vb.net

Извлечете числа, последвани от конкретен текст - regex, regex-negation

NSRegularExpression за извличане на подмножество текст в Swift 3 - regex, swift3, nsregularexpression

C # екстракт от Regex (ip + бяло пространство + порт) в дълъг низ - regex, ip, порт

Regex, извличане var в интервала - regex, msdn, dngrep

Редовни изрази и променливи - регенерация

Нуждаете се от помощ с тласък на библиотеката regexp - regex, boost-regex

Идеи за приложенията - флагове за регенерация - регенериране, интродукция за лазерно приложение

Regex функционалност в g ++ 5.1 - regex, g ++, gcc5

PHP регулярен израз за извличане на цитиран текст в тялото на маркера - php, regex

.net използвайки regex за извличане на шаблон от низ - .net, regex

Java регекс към jquery регекс конвертиране - java, jquery, regex

php Съответства на стойността на javascript - javascript, php, regex

Извлечете с Regex - c #, регекс

Използване на Regex за думи в кавички, а също и в asterisks в C # - c #, regex

Как да зададете char '+' && '-' в Regex? - c #, .net

Regex да извлече от квадратни скоби? - c #, regex, jmeter

Regex съвпада с повече от {7} - c #, regex