Pomoc pri programovaní, odpovede na otázky / krajta / Použite re.sub, aby ste nahradili premennú, ktorá je regex, reťazcom - python

Použite re.sub nahradiť nahradenie premennej, ktorá je regex reťazcom python

Potrebujem vymeniť KEY od za VAL. Kľúč je regex ako import. * A val je reťazec ako „dôležitý“. Viem, že tento kód nie je dobrý, pretože kľúč je regulárny, ale nenašiel som riešenie, ktoré by fungovalo.

#import stem dict
d = {}
with open("Stem rečnik.txt") as f:
for line in f:
key, val = line.split(":")
d[key.replace("n","")] = val.replace("n","")

#define tokenizer
def custom_tokenizer(text):
#split- space
tokens = nltk.tokenize.word_tokenize(text)
#stemmer
for key,val in d.items():
tokens=[token.replace(key,val) for token in tokens]
#remove special characters
tokens=[re.sub(r"[^a-zA-Z0-9]","",token) for token in tokens]
return tokens
cv=CountVectorizer(tokenizer= custom_tokenizer,analyzer ="word",encoding="utf-8", min_df=0, max_df=1.0)
post_textCV= cv.fit_transform(post_text)
df=DataFrame(post_textCV.A, columns=cv.get_feature_names())
print(df.head)

Problém je teda v tomto riadku:

tokens=[token.replace(key,val) for token in tokens]

odpovede:

1 pre odpoveď č. 1

token.replace(key,val) dovoláva str.replace čo je nahradenie základného reťazca.

Ak chcete zavolať regulárnu náhradu, urobte to namiesto toho:

tokens=[re.sub(key,val,token) for token in tokens]

to znamená, že sa zdá byť dosť neefektívne, čím sa obnoví porozumenie zoznamu pre každý pár kľúč / val.

Súvisiace otázky

Vlastné vyhľadávanie a Nahradiť v poznámkovom bloku ++ - utf-8, notepad ++, nahradiť

Nahraďte premenný reťazec vo vbs - string, vbscript

Regex používa podmienku na výsledky zápasu iného regex - regex, reťazec, vnorený

Pridávanie premenlivého medzery medzi dvoma reťazcami - regex

regex nahradí celý znak v reťazci - regex, finalbuilder

Zreťazenie premennej s regex skupiny zápas v regex.replace - regex, vb.net

Powershell regulárny výraz nahradí číslicu reťazcom s premenlivou dĺžkou - regex, powershell, replace, expression

Ako vytvoriť jednoduchú spustiteľnú aplikáciu založenú na kóde Pythonu? [duplicitné] - python, spustiteľný

Nahradiť obdobia (desatinné body) v číslach čiarami v pandách pomocou regex - python, regex, panda

panda: Dataframe.replace () s regex - python, reťazec, pandy, nahradiť, plávajúci bod

Ako napísať regex výraz nahradiť reťazec v Oracle, napríklad napr. 1_10! 55AC - .net, regex, oracle11g, regex-negation

Potrebujete regex, aby sa zhodoval s [# URL ^ Url Description ^ #] - c #, regex

Regex na odstránenie bodov z reťazca - c #, regex

Regex.Replace nie nahrádza - c #, regex

Regex nahradiť všetky špeciálne znaky s výnimkou lomítok? - c #, regex

regulárny výraz na odmietnutie nealfanumerických znakov - c #, asp.net, regex, nahradiť

Posledných pár riadkov súboru CSV sa odreže - c #, io

Nahradenie špecifického počtu znakov medzery v reťazcoch - c #, .net

Regex .NET otázka - c #, regex

Nahradenie / s regex - c #, regex, reťazec