Допомога у програмуванні, відповіді на питання / Python / розділити рядки utf8 на частини з регулярним виразом - python, regex, utf-8

розділіть рядки utf8 на частини з regexp - python, regex, utf-8

Мені потрібно знайти в текстових рядках, які починаються з =? і закінчується ?= і перекласти їх. Я закінчив таким виразом:

re.sub("=?[w?-/=+:;_,[]()<>]+?=", decode_match, string)

Це працює в 95% випадків, але не вдається зі схожими рядками:

=?utf-8asdfaDDS23=eFF?=-=?utf-8?eadf-,=?=

Хтось може спробувати допомогти?

Відповіді:

0 для відповіді № 1

Вам потрібен той випадок, де у вас є? без відповідності знаку? = у вашому шаблоні

"=?(?:[^?]|?[^=])+?="

0 для відповіді № 2

Чи str.split("=?") зробити трюк?

0 для відповіді № 3

чому ти не пишеш?:

re.sub("=?.+??=", decode_match, string)

Цей регулярний вираз буде збігатися два рази в "=? Utf-8asdfaDDS23 = eFF? = - =? Utf-8? Eadf -, =? ="

"=?utf-8asdfaDDS23=eFF?="

"=?utf-8?eadf-,=?="

Це те, що ти хочеш? Викликаючи невдачу, ви повинні подавати її з більшою точністю.

Схожі запитання

Доступ до SQL> Виберіть "Висоту" з тексту - sql, ms-доступ, виберіть, розділити

Regexp, щоб відповідати повторюваній підрядці - ruby, regex

відповідність багатобайтових символів utf8 в регулярному виразі mongodb - регулярний вираз, mongodb

складання нечіткого регулярного виразу з python regex - python, regex, fuzzy-search, pypi-regex

Python regex для видалення певного шаблону зі списку рядків [closed] - python, regex, python-2.7

Сплітовий рядок байтів масиву в Python - python, regex, python-2.7

Фільтрування та перетворення списку Python - python, список, фільтрація, перетворення

MySQL RegExp невірно відповідає символи з накресленим символами з кодуванням utf8 та бінарним співставленням - mysql, regex, utf-8, base64

Чи можете ви помістити Java Retval в масив - java, масиви, регулярні виклики, рядок

як шукати до останнього / [закрито] - javascript, regex

Регулярний вираз, щоб отримати рядок і число між квадратними дужками - javascript - javascript, regex

Mongoose.js і об'єкт запиту з Regexp - javascript, regex, node.js, mongodb, mongoose

Як додати, щоб мій регулярний вираз не міг аналізувати певні частини рядка? - javascript, regex

Break Apart string в JavaScript із трьома частинами [дублікат] - javascript, regex, split

Замінити Javascript не замінює - javascript, regex

Чи можливо з'єднати змінну в Split Regexp у Javascript? Наприклад: var.split (/ [A-Z] / + змінна + / d /); [дублікат] - javascript, regex

Розділяючи за допомогою regexp з винятками, уникайте перезапису функції Split - c #, regex, split

Формат ToString - c #, vb.net, string.format

Розділити рядок на основі регулярного виразу - c #, regex

Розділити рядки на основі певних символів - c #, рядок, список, підрядка