Помощ при програмиране, отговори на въпроси / Ява / Capture Regex повтарящ се низ между наклонени черти в URL - java, regex, string

Capture Regex повторение на низ между срязания в URL - java, regex, string

Имам следния частичен URL адрес, който може да бъде

/ Тя / ЮЯ/ Тест / параметър + 1 / параметър-2/1234 / gfd4

По принцип две букви в началото наклонена чертадруг неизвестен низ и след това поредица от повтарящи се низове между наклонени черти Трябва да уловя всеки низ (знам, че разделянето с / разделителя би било добре, но ми е интересно да знам как мога да извлека с regex). Първо излязох с това:

^/([a-zA-Z]{2})/([a-zA-Z]{1,10})(/[a-zA-Z1-9+-]+)

но само улавя

група1: то група2: xyz група3: / тест

и разбира се игнорира останалата част от низа.

Ако добавя знак * в края, той улавя само последното изречение:

^/([a-zA-Z]{2})/([a-zA-Z]{1,10})(/[a-zA-Z1-9+-]+)*

група1: то група2: xyz група3: / gfd4

Така че, очевидно ми липсват някои основи, така че в допълнение към правилния регекс бих искал да имам обяснение.

Аз маркирах като Java, защото двигателят, който анализира регекса е JDK 7. По мое знание всеки двигател може да има разлики.

Отговори:

0 за отговор № 1

Като споменато тук, това се очаква:

С една група в модела, можете да получите само един точен резултат в тази група.
Ако вашата група за заснемане се повтаря от шаблона (използвахте количественото число + на заобикалящата група, която не улавя), се съхранява само последната стойност, която съответства на нея.

Бих предпочел да уловя останалата част от низ в group3 ((/.*$), като в тази демонстрация), след това използвайте сплит около "/". Или приложете шаблон на yhat върху останалата част от низ:

Pattern p = Pattern.compile("(/[a-zA-Z1-9+-]+)");
Matcher m = p.matcher(str);
while (m.find()) {
String place = m.group(1);
...
}

Свързани въпроси

ако улавянето на регекс съдържа скоба след това улавяне на съдържанието на скоба друго улавяне на групата - regex, regex-група

Добавяне на променливи междинен интервал между два струна - regex

Regex за низ "hh: mm: ss tt" - regex, c # -4.0

Свързване на променлива със съвпадение на груповата група в regex.replace - regex, vb.net

Regex в C # връща само първия мач - regex

Отрицателен Regex Python - питън, регекс

PCRE Patterns Редовно изражение за цифра Следва ли някакъв брой цифри и напред линии без двойни наклони, завършващи с цифра? - php, regex

итерират съвпадения в неназовани групи - .net, regex, asp.net-4.0

.net използвайки regex за извличане на шаблон от низ - .net, regex

Могат ли да се прегрупират заснемане на низ, без да се използват групи? - .net, регекс

Regex find () не е вярно; откриване на дублирани знаци в низ - java, regex

Редовно изражение Java грешка - java, regex

Regex за премахване на евакуационни наклони в низ - java, regex

java заменя само regex a-z0-9 - java, regex

Заместване, ако даден символ е нечетен няколко пъти в началото на низ || Regex - java, регекс

Java: RegEx множество мачове в същия "фрагмент" - java, regex

Regex за номер, заобиколен от наклонени черти - javascript, regex, pre-match

Regex да замени всички специални знаци с изключение на наклонените линии? - c #, регекс

улавяне на повтаряща се група в regex - c ++, regex

Регулярен израз, който отрича бялото пространство, предните наклони и наклона назад - c #, регенериране