/ / विम रेगेक्स यूनिकोड वर्णों से मेल खाता है जैसे कि गैर-शब्द - रेगेक्स, विम, यूनिकोड

विम रेगेक्स मैक्स यूनिकोड वर्ण गैर-शब्द - रेगेक्स, विम, यूनिकोड के रूप में हैं

मेरे पास निम्न पाठ है:

üyü

निम्नलिखित रेगेक्स खोज पात्रों के ü से मेल खाती है:

/W

क्या विम रिकेज में एक यूनिकोड ध्वज है?

उत्तर:

जवाब के लिए 3 № 1

दुर्भाग्य से, ऐसा कोई झंडा नहीं है (अभी तक)।

कुछ बिल्ट-इन कैरेक्टर क्लासेस (कर सकते हैं) में मल्टी-बाइट कैरेक्टर शामिल हैं, दूसरों को "टी। आम नहीं है।" w a l u कक्षाओं में केवल ASCII होता है अक्षर, इसलिए भी umlaut वर्ण "t" उनमें शामिल हैं, जिसके लिए अग्रणी है अप्रत्याशित व्यवहार! यह भी देखें https://unix.stackexchange.com/a/60600/18876.

में "isprint" विकल्प (और "iskeyword", जो निर्धारित करता है कि किस गति को पसंद करते हैं w आगे बढ़ें), मल्टी-बाइट वर्ण 256 और ऊपर हमेशा शामिल हैं, केवल 255 तक विस्तारित ASCII वर्ण के साथ निर्दिष्ट हैं इस विकल्प।


जवाब के लिए 2 № 2

मैं हमेशा उपयोग करता हूं:

ASCII                           utf-8
-----                           -----
w                              [a-zA-Zu0100-uFFFF]
W                              [^a-zA-Zu0100-uFFFF]

उत्तर № 3 के लिए 1

आप उपयोग कर सकते हैं %uXXXX एक मल्टीबाइट चरित्र से मेल खाने के लिए। उस स्तिथि में…

/%u00fc

लेकिन मुझे एक ऐसे झंडे की जानकारी नहीं है, जो पूरे मिलान को बहु-मैत्रीपूर्ण बना दे।

ध्यान दें कि डिफ़ॉल्ट मान के साथ iskeyword UNIX सिस्टम पर, ü से मेल खाती है k.