/ / Vim regex съвпада с символите на Unicode са като не-дума - regex, vim, unicode

Vim regex съвпада с символите с единен знак са като не-дума - regex, vim, unicode

Имам следния текст:

üyü

Следващото търсене повторно търсене съответства на знаците ü:

/W

Има ли флаг с unicode във Vim regex?

Отговори:

3 за отговор № 1

За съжаление, няма такъв флаг (все още).

Някои вградени класове знаци (могат) включват многобайтови знаци, други не общуват w a l u класовете съдържат само ASCII писма, така че дори и символите на знака не са включени в тях, което води до неочаквано поведение! Вижте също https://unix.stackexchange.com/a/60600/18876.

В "isprint" опция (и "iskeyword", което определя какви движения са w преместване), многобайтови знаци 256 и горе, винаги са включени, само разширени ASCII знаци до 255 са посочени с тази опция.


2 за отговор № 2

Винаги използвам:

ASCII                           utf-8
-----                           -----
w                              [a-zA-Zu0100-uFFFF]
W                              [^a-zA-Zu0100-uFFFF]

1 за отговор № 3

Можеш да използваш %uXXXX за да съответства на многобайтов знак. В този случай…

/%u00fc

Но аз не знам знамето, което би направило всичко съвпадащо с многообразието.

Имайте предвид, че с стойността по подразбиране iskeyword на системи UNIX, ü се съгласува с k.