प्रोग्रामिंग, सवालों के जवाब में मदद करें / दे घुमा के / सामग्री के आधार पर कई आउटपुट में विभाजित इनपुट? - बैश, यूनिक्स, शेल, टेक्स्ट

सामग्री के आधार पर एकाधिक आउटपुट में इनपुट विभाजित करें? - बैश, यूनिक्स, खोल, पाठ

मान लें कि एक फ़ाइल है जो इस तरह दिखती है:

xxxx aa whatever
yyyy bb whatever
zzzz aa whatever

मुझे इसमें 2 फ़ाइलों में विभाजित करना पसंद है:

प्रथम:

xxxx aa whatever
zzzz aa whatever

दूसरा:

yyyy bb whatever

अर्थात। मैं पंक्तियों में कुछ मूल्य के आधार पर पंक्तियों को समूहित करना चाहता हूं (नियम यह हो सकता है: रिक्त स्थान द्वारा अलग किया गया 2 शब्द), लेकिन समूहों के भीतर लाइनों को फिर से व्यवस्थित न करें।

बेशक मैं इसे करने के लिए एक कार्यक्रम लिख सकता हूं, लेकिन मैं सोच रहा हूं कि क्या कोई तैयार उपकरण है जो ऐसा कुछ कर सकता है?

क्षमा करें, मैंने इसका उल्लेख नहीं किया, क्योंकि मैंने इसे ग्रहण किया थाबहुत स्पष्ट है - विभिन्न "शब्दों" की संख्या बहुत बड़ी है। हम उनमें से कम से कम 10000 के बारे में बात कर रहे हैं। अर्थात। हाथ से पहले शब्दों की गणना पर आधारित कोई भी समाधान काम नहीं करेगा।

और यह भी - मैं वास्तव में बहु-पास विभाजन की तरह नहीं होगा - प्रश्न में फाइलें आमतौर पर बहुत बड़ी हैं।

उत्तर:

उत्तर № 1 के लिए 6

इससे नाम की फाइलें बन जाएंगी output.aa, output.bb, आदि।:

awk "{print >> "output." $2}" input.file

उत्तर № 2 के लिए 1

ठीक है, तुम एक grep कर सकते हैं कि लाइनों से मेल खाते हैं, और एक grep -v लाइनों है कि "टी मैच" पाने के लिए।

हम्म, आप कर सकते हैं sort -f" " -s -k 2,2, लेकिन वह "ओ" (एन लॉग एन) है।

संबंधित सवाल

यूनिक्स वातावरण 'सीडी' कमांड के लिए स्रोत कोड - यूनिक्स, chdir

पट्टी में प्रॉम्प्ट को कैसे बदलें - यूनिक्स, खोल, प्रॉम्प्ट

लाइनों की गणना के आधार पर पाठ या सीएसवी फ़ाइल (100 हजार) को सीएसवी फाइलों में विभाजित करने के लिए (प्रत्येक में 10k होता है) कैसे? - खोल, यूनिक्स

यूनिक्स शैल स्क्रिप्ट के बारे में - खोल, यूनिक्स

Awk - shell, यूनिक्स, awk का उपयोग कर खोल स्क्रिप्ट में एकाधिक तर्क

यूनिक्स - खोल, सीरियल-प्रसंस्करण में कमांड 1 को पूरा करने के बाद कमांड 2 निष्पादित करने के लिए खोल स्क्रिप्ट

यूनिक्स आदेश आर से रोल फंक्शन के माध्यम से - आर, बैश, rstudio, knitr, गिट-बाश

शेल स्क्रिप्ट [डुप्लिकेट] के माध्यम से एक COBOL प्रोग्राम को कैसे कॉल करें - लिनक्स, बैश, खोल, यूनिक्स, कोबोल

यूनिक्स में खोल स्क्रिप्ट का उपयोग कर पाठ फ़ाइल खोजना - लिनक्स, बैश, खोल, awk, sh

जेनकींस: बैश स्क्रिप्ट - लिनक्स, बैश, शैल, हडसन, जेनकींस में विशेष पात्र डाले जा रहे हैं

बैश टाइप किए बिना खोल स्क्रिप्ट कैसे चलाएं (बैश कमांड त्रुटि: मैपफ़ाइल नहीं मिला) - लिनक्स, बैश, खोल, यूनिक्स

लिनक्स ' कट ' कमांड लाइन और बदलें-लिनक्स, मार, शैल, यूनिक्स

भंडारण चर में पाठ उत्पादन (मार)-लिनक्स, मार, शैल, यूनिक्स

कर्नेल और खोल के बीच संचार - लिनक्स, खोल, ऑपरेटिंग सिस्टम

जावा प्रोग्राम (कक्षा> .jar) यूनिक्स शैल के रूप में (sh / bash के स्थान पर)? - जावा, बैश, खोल, यूनिक्स, निष्पादन

httpd द्वारा निष्पादित बैश स्क्रिप्ट उपयोगकर्ता पर्यावरण चर को नहीं पढ़ती है - बैश, अपाचे, अमेज़ॅन-ec2

खंडों में फ़ाइल विभाजित करें? - मार, फ़ाइल, पाठ, विभाजन

यूनिक्स स्क्रिप्टिंग - न्यूनतम और अधिकतम (बैश शैल) ढूँढना - बैश, खोल, यूनिक्स, स्क्रिप्टिंग

समांतर में दो या दो से अधिक बैश / यूनिक्स स्क्रिप्ट कैसे चलाएं [डुप्लिकेट] - बैश, खोल, यूनिक्स, समांतर-प्रोसेसिंग

शानदार 3 - फ़ाइल प्रकार के लिए विशिष्ट प्लगइन सिंटैक्स हाइलाइट जोड़ें - bash, shell, sublimetext3