Допомога у програмуванні, відповіді на питання / Python / Використовуйте re.sub для заміни змінної, яка є регулярним виразом, рядком - python

Використовуйте re.sub, щоб замінити змінну заміни, яка є регулярним виражком з рядком - python

Мені потрібно замінити KEY на VAL. Ключ - це регулярний вираз, як імпорт. *, А val - рядок типу "важливо". Я знаю, що цей код непоганий, тому що ключ - це регулярний вираз, але я не міг знайти рішення, яке працює.

#import stem dict
d = {}
with open("Stem rečnik.txt") as f:
for line in f:
key, val = line.split(":")
d[key.replace("n","")] = val.replace("n","")

#define tokenizer
def custom_tokenizer(text):
#split- space
tokens = nltk.tokenize.word_tokenize(text)
#stemmer
for key,val in d.items():
tokens=[token.replace(key,val) for token in tokens]
#remove special characters
tokens=[re.sub(r"[^a-zA-Z0-9]","",token) for token in tokens]
return tokens
cv=CountVectorizer(tokenizer= custom_tokenizer,analyzer ="word",encoding="utf-8", min_df=0, max_df=1.0)
post_textCV= cv.fit_transform(post_text)
df=DataFrame(post_textCV.A, columns=cv.get_feature_names())
print(df.head)

Отже, проблема полягає в цій лінії тут:

tokens=[token.replace(key,val) for token in tokens]

Відповіді:

1 для відповіді № 1

token.replace(key,val) викликає str.replace який є базовим рядком заміни.

Для виклику заміни регулярного виразу просто зробіть це замість цього:

tokens=[re.sub(key,val,token) for token in tokens]

зважаючи на це, це здається досить неефективним, будуючи розуміння списку для кожної пари / валу пари.

Схожі запитання

Користувальницький пошук та заміна в Notepad ++ - utf-8, notepad ++, замінити

Замініть рядок змінної у vbs - string, vbscript

Regex, використовуючи умови для результатів матчів іншого регулярного виразу - регулярний вираз, рядок, вкладені

Додавання змінного пробілу між двома рядками - регулярним виразом

регулярний вираз, щоб замінити весь символ у рядку - regex, finalbuilder

Збігання змінної з відповідною групою регулярних виразів у regex.replace - regex, vb.net

Регулярний вираз Powershell замінити цифру рядами змінної довжини - regex, powershell, replace, expression

Як створити просту виконувану програму на основі коду Python? [дублікат] - python, виконуваний файл

Замініть періоди (десяткові крапки) на числа з комами в пандах, використовуючи регулярні вирази - python, regex, pandas

панди: Dataframe.replace () з регулярним вираженням - python, string, pandas, replace, плаваюча точка

Як написати regex-вираз, щоб замінити рядок в oracle, наприклад, наприклад, 1_10! 55AC - .net, regex, oracle11g, regex-negation

Потрібні Regex, щоб відповідати [# URL ^ Url Опис ^ #] - c #, regex

Regex для видалення крапки з рядка - c #, regex

Regex.Replace не замінювати - c #, regex

Regex для заміни всіх спеціальних символів, крім косою риси? - c #, регулярний вираз

регулярне вираження, щоб відхилити не буквено-цифрові символи - c #, asp.net, regex, замінити

Останні кілька рядків файлу CSV видаляються - c #, io

Заміна певної кількості пробілів у рядках - c #, .net

Regex .NET питання - c #, regex

Заміна / за допомогою regex - c #, regex, string