Допомога у програмуванні, відповіді на питання / Python / Regex Unicode в Python 3 (з коду Python 2) - python, regex, python-3.x, unicode, python-2.x

Реєкс формату Unicode в Python 3 (з коду Python 2) - python, regex, python-3.x, unicode, python-2.x

Я намагаюся перетворити свій сценарій Python 2 на Python 3. Як ми робимо Regex з Unicode?

Це те, що я маю в Python 2, який працює. Він замінює лапки на «і»:

text = re.sub(ur""(.*?)"", ur"«1»", text)

У мене є насправді складні, які "ур" зробив це так просто. Але це не працює в Python 3:

text = re.sub(ur"هsایم([].،:»)s])", ur"هu200cایم1", text)

Відповіді:

1 для відповіді № 1

Всі рядки в Python3 є унікальними за замовчуванням. Просто видаліть u і ви повинні бути в порядку.

У Python2 рядки - це списки байтів за замовчуванням, тому ми використовуємо u позначити їх як рядки Unicode.

0 для відповіді № 2

Оскільки Python 3.0, мовою є стиль str, який містить Unicode characters, тобто будь-який рядок, створений за допомогою "unicode rock!" "unicode rocks!", або синтаксис тривимірного цитування зберігається як Unicode.

HOWTO Юнікод Цей документ допоможе вам.

так що ви просто хочете, щоб кожен, хто ви робите в Python2, і це буде працювати, не матиме додаткових ефектів.

Схожі запитання

Різні режими регулярного виклику в Python 2.7 та Python 3.5 - regex, python-2.7, python-3.x

Як отримати Unicode Point Point (як з бази даних) у Python 3 - python, unicode

Використання Unicode Malayalam у python - python, unicode, character-encoding, python-unicode

Регулярний виклад python замінити Unicode - python, regex

Python unicode character codes? - python, unicode

Python: RegEx, весь випадок тексту "NN.N відсоток" до "NN.N%" - python, regex, python-3.x

знайти всі збіги для unicodes в рядку в python - python, regex, python-2.7, unicode, python-unicode

Прапор Python Regex DUPLICATE_NAMES - python, regex, python-2,7

python regex з Unicode, щоб відповідати назві міста - python, regex, unicode

Заміна HTML-тегів з використанням регулярних виразів і python - python, html, regex, tags

Чи Подушка хоче, щоб мої текстові параметри були юнікодами чи рядками? - python, unicode, python-imaging-бібліотека, python-2.x

Як видалити спеціальний символ з рядка в python, якщо рядок містить скрипт, відмінний від англійської [duplicate] - python, regex, string, python-3.x

Python надзвичайно загадковою поведінкою унікального кодування регулярних виразів - python, regex, unicode, python-2.7

Регулярні вирази та Unicode в Python: різниця між sub і findall - python, regex, unicode

Python 3: Як конвертувати Unicode текст в оригінальній формі? - python, python-3.x, python-unicode

Витягувати лише символи Юнікоду з рядка з використанням регулярних виразів - python, regex, unicode

рядок кодування помилок як unicode в python 2.7? - python, python-2.7, python-3.x, unicode

Як я можу вказати ряд унікальних символів у регулярному вираженні в python? [дублікат] - python, regex, unicode

Як перетворити елементи списку в Unicode без втрати структури списку - python, list

Відмінності синтаксису регулярного виразу в Python та Java - java, python, regex