Pomoc pri programovaní, odpovede na otázky / krajta / Python Regex pre koniec riadku - python, regex

Python Regex pre koniec riadku - python, regex

Snažím sa napísať regulárny výraz, ktorý pridá medzeru pred a za bodkou. Chcem to však iba v prípade, že za bodkou je medzera alebo koniec riadku.

Nemôžem to však urobiť pre prípady konca riadku.

Eg.

I want a hotel. >> I want a hotel .
my email is zob@gmail.com >> my email is zob@gmail.com
I have to play. bye! >> I have to play . bye!

Nasleduje môj kód:

# If "Dot and space" after word or number put space before and after
utterance = re.sub(r"(?<=[a-z0-9])[.][ $]"," . ",utterance)

Ako opravím svoj regulárny výraz, aby som sa ubezpečil, že funguje aj môj prvý príklad, vyskúšal som vloženie znaku $ do hranatej zátvorky, ale nefunguje to.

odpovede:

1 pre odpoveď č. 1

[ $] definuje a trieda znakov pozostávajúcich z medzery a znaku dolára, takže sa zhoduje s medzerou alebo dolárom (doslova). Na vyrovnanie medzery alebo konca riadku použite ( |$) (v tomto prípade, $ zachováva to osobitný význam.

0 pre odpoveď č. 2

Hlavnou otázkou je to $ vnútri znakovej triedy sa označuje literál $ symbol, stačí skupinový konštrukt tu.

Navrhujem použiť nasledujúci kód:

import re
regex = r"([^W_]).(?:s+|$)"
ss = ["I want a hotel.","my email is zob@gmail.com", "I have to play. bye!"]
for s in ss:
result = re.sub(regex, r"1 . ", s).rstrip()
print(result)

Pozrite si Python demo

podrobnosti:

([^W_]) - Skupina 1 zhodujúca sa s akýmkoľvek písmenom alebo číslicou
. - doslova bodka
(?:s+|$) - zoskupenie, ktoré sa zhoduje s 1+ medzerami alebo koncami strunovej kotvy (tu, $ zodpovedá koncu reťazca.)

Na rstrip odstráni koncový priestor pridaný počas výmeny.

Ak používate Python 3, [^W_] predvolene sa zhodujú všetky písmená a číslice Unicode. V Pythone 2 re.U flag umožní toto správanie.

Poznač si to s+ v poslednom (?:s+|$) „zmrští“ viac medzier na 1 miesto.

0 pre odpoveď č. 3

Použite výraz hľadáčika (?=) nájsť . za ktorým nasleduje medzera alebo koniec riadku n:

utterance = re.sub("\.(?= )|\.(?=n)", " . ", utterance )

Súvisiace otázky

Python: Odstráňte všetko okrem písmen a bielych priestorov reťazca - python, regex

Regex w + rozdeľuje slová s jedinou citáciou [closed] - python, regex

Čítanie regulárnych výrazov zo súboru XML, uloženie do zoznamu a následné použitie - python, regex, xml, list

Python: RegEx, všetky výskyty textu "NN.N percent" až "NN.N%" - python, regex, python-3.x

zostavenie fuzzy regexp s python regex - python, regex, fuzzy-search, pypi-regex

Fuzzy regex matching with python vracia prázdny zoznam - python, regex, fuzzy, pypi-regex

python regex sa nezhoduje s výstupom dig - python, regex, dns, dig

Použitie pravidelných výrazov na mojom Raspberry Pi - python, regex, raspberry - pi, raspbian

python regex [: alpha:] - python, regex

RegEx Perl syntax s Pythonom - python, regex

Python Regex DUPLICATE_NAMES Flag - python, regex, python-2.7

Nahradenie značky HTML pomocou regexu a pythonu - python, html, regex, tagy

Python chyba kvôli regexu vo vnútri Google Big Query - python, regex, google-bigquery

Regex pre veľké a podčiarknuté medzi percentuálnymi znakmi - python, regex

Regex pre extrakciu názvu začínajúc pánom | pani - python, regex, findall

Zodpovedajúce vstupy s regulárnym výrazom v Pythone [duplicate] - python, regex, input, match

Regex zodpovedá čiary medzi dvoma konkrétnymi riadkami, v Python-python, regex, newline

Problém s regex backreference v Pythone - python, regex, python-3.x

Negatívny Regex Python - python, regex

Rozdiely v syntaxe regex v jazykoch Python a Java - java, python, regex