मैं रूबी का उपयोग करके URL की सूचियों से लिंक्डइन प्रोफ़ाइल पृष्ठों को निकालने का एक तरीका ढूंढ रहा हूं। वर्तमान में मैं URL पर लूप कर रहा हूं और इस रेगेक्स के खिलाफ मिलान कर रहा हूं:
/^http://.+.linkedin.com/(pub|in)/
हालाँकि, लिंक्डइन प्रोफ़ाइल निर्देशिका पृष्ठों के URL इस प्रकार हैं:
http://www.linkedin.com/pub/dir
, तो मैं किसी भी लिंक है कि से बचने के लिए देख रहा हूँउनमें पब / दिर पथ। मुझे पता है कि यह रूबी रीजेक्स में चरित्र वर्गों को नकारना संभव है, जैसे कि [^ abc] किसी भी वर्ण से मेल खाता है जो isn "t abc नहीं है। वहाँ तार के साथ एक ही करने के लिए एक रास्ता है? अर्थात। "दिर" के अलावा पात्रों के किसी भी क्रम से मेल?
उत्तर:
उत्तर № 1 के लिए 7आप एक नकारात्मक रूपांतर का उपयोग कर सकते हैं। कुछ इस तरह
(pub(?!/dir)|in)