/ / regex за намиране на тагове / атрибути са в html код [дубликат] - c ++, regex, pcre

regex за намиране на тагове / атрибути са в html код [дубликат] - c ++, regex, pcre

Искам да намеря някои общи html тагове / атрибути

<a href="xyz">this is an example of an href</a>

Искам да намеря първото копие на "href", тъй като то се използва вътре в HTML кода, но не и вторият, тъй като то е просто html.

Мога да се опитам да търся код в "<...>" разделители, но има 2 проблема, повечето браузъри ще позволят "<", дори и да е "gt"

the letter A is < than the letter B

или

<a name="24 is > than 12">this is an example of an href</a>

Така че мога безопасно да търся атрибути вътре в html дори ако не винаги е 100% правилно форматиран код, използвайки Regex?

Отговори:

0 за отговор № 1

Регексът <s*as+(?:w+s*=s*(?:"[^"]*"|"[^"]*")s+)*hrefs*=s*(?:"([^"]*)"|"([^"]*)")

ще съответства на низове # 1, 4, 5, 7, 8

1: <a href="xyz">this is an example of an href</a>

2: <a name="24 is > than 12">this is an example of an href</a>

3: <a name="24 is > than 12">this is an example of an href="xyz"</a>

4: <a href="xyz" name="24 is > than 12">this is an example of an href</a>

5: <a name="24 is > than 12" href="xyz">this is an example of an href</a>

6: <a name="24 is > than 12 href="xyz"">this is an example of an href</a>

7: <a name="24 is > than 12 href="xyz"" href="xyz">this is an example of an href</a>

8: <a name="24 is > than 12 href="xyz"" href="xyz">this is an example of an href="xyz"</a>

Тестван чрез Regex Онлайн.

В случай на използване " цитати, трябва да използвате втората група за съвпадение (matches[2]).