Помощ при програмиране, отговори на въпроси / Питон / Използвайте re.sub да замени замени променлива, която е regex с низ - python

Използвайте re.sub, за да замените заместващата променлива, която е regex, с string-python

Трябва да замените KEY от с VAL. Ключът е regex като import. * И val е низ като "важен". Знам, че този код не е добър, защото ключът е regex, но не можах да намеря решение, което да работи.

#import stem dict
d = {}
with open("Stem rečnik.txt") as f:
for line in f:
key, val = line.split(":")
d[key.replace("n","")] = val.replace("n","")

#define tokenizer
def custom_tokenizer(text):
#split- space
tokens = nltk.tokenize.word_tokenize(text)
#stemmer
for key,val in d.items():
tokens=[token.replace(key,val) for token in tokens]
#remove special characters
tokens=[re.sub(r"[^a-zA-Z0-9]","",token) for token in tokens]
return tokens
cv=CountVectorizer(tokenizer= custom_tokenizer,analyzer ="word",encoding="utf-8", min_df=0, max_df=1.0)
post_textCV= cv.fit_transform(post_text)
df=DataFrame(post_textCV.A, columns=cv.get_feature_names())
print(df.head)

Проблемът е този ред тук:

tokens=[token.replace(key,val) for token in tokens]

Отговори:

1 за отговор № 1

token.replace(key,val) позовава str.replace който е основен низ замени.

За да се обадите на regex замяна, направете го вместо това:

tokens=[re.sub(key,val,token) for token in tokens]

казано, това изглежда доста неефективно, възстановявайки разбирането на списъка за всяка ключова / вал двойка.

Свързани въпроси

Персонализирано търсене и замяна в Notepad ++ - utf-8, бележник ++, заменете

Заменете променлив низ в VBS - низ, vbscript

Regex използва условие за резултатите от мача на друг regex - regex, низ, вложени

Добавяне на променливи междинен интервал между два струна - regex

regex да замени целия знак в низ - regex, finalbuilder

Свързване на променлива със съвпадение на груповата група в regex.replace - regex, vb.net

Powershell регулярен израз за замяна на цифра с низ с променлива дължина - regex, powershell, replace, expression

Как да създадем просто изпълнимо приложение, базирано на Python код? [duplicate] - питън, изпълним

Замяна на периоди (десетични знаци) в числа с запетаи в пандата с помощта на регенериране - python, regex, pandas

pandas: Dataframe.replace () с regex - python, string, pandas, replace, floating-point

Как да напишете регекс израз, за да замените низа в оракула, например като 1_10! 55AC - .net, regex, oracle11g, regex-negation

Нуждаете се от Regex да съответства на [# URL ^ Url Description ^ #] - c #, regex

Regex за премахване на точки от низ - c #, regex

Regex.Replace не замества - c #, regex

Regex да замени всички специални знаци с изключение на наклонените линии? - c #, регекс

регулярен израз, за да отхвърлите не-буквено-цифрови символи - c #, asp.net, regex, заменете

Последните няколко реда CSV файл се отрязват - c #, io

Замяна на конкретен брой символи за местоположението в низове - c #, .net

Regex .NET въпрос - c #, регекс

Подмяна / с регенерация - c #, regex, низ