Pomoc pri programovaní, odpovede na otázky / tresnúť / Rozdeliť vstup do viacerých výstupov na základe obsahu? - bash, unix, shell, text

Rozdeliť vstup do viacerých výstupov založených na obsahu? - bash, unix, shell, text

Predpokladajme, že existuje súbor, ktorý vyzerá takto:

xxxx aa whatever
yyyy bb whatever
zzzz aa whatever

Rád by som ich rozdelil na 2 súbory, ktoré obsahujú:

najprv:

xxxx aa whatever
zzzz aa whatever

druhá:

yyyy bb whatever

Tj. Chcem zoskupiť riadky podľa určitej hodnoty v riadkoch (pravidlo môže byť: 2. slovo oddelené medzerami), ale nepreusporiadajte riadky v rámci skupín.

Samozrejme, že na to môžem napísať program, ale zaujímalo by ma, či existuje nejaký pripravený nástroj, ktorý dokáže niečo také?

Ospravedlňujeme sa, nespomenul som to, ako som predpokladalcelkom zrejmé - množstvo rôznych „slov“ je obrovské. hovoríme o nich najmenej 10 000. Tj. žiadne riešenie založené na vymenovaní slov pred rukou nebude fungovať.

A tiež - rád by som nemal rád rozdelenie na viac priechodov - príslušné súbory sú zvyčajne dosť veľké.

odpovede:

6 pre odpoveď č. 1

Takto sa vytvoria súbory s názvom output.aa, output.bb, atď.:

awk "{print >> "output." $2}" input.file

1 pre odpoveď č. 2

Mohli by ste urobiť grep, aby ste dostali čiary, ktoré sa zhodujú, a grep-v, aby ste získali čiary, ktoré sa nezhodujú.

Hm, mohol by si to urobiť sort -f" " -s -k 2,2, ale to je O (n log n).

Súvisiace otázky

zdrojový kód pre príkaz unix prostredia 'cd' - unix, chdir

Ako zmeniť výzvu v tmelu - unix, shell, výzva

ako rozdeliť text alebo csv súbor (100 tisíc) do csv súborov (každý z nich obsahuje 10k) na základe počtu riadkov? - shell, unix

o Unix Shell Script - shell, unix

Viac argumentov v shellovom skripte pomocou awk - shell, unix, awk

shell skript vykonať príkaz2 po dokončení príkazu1 v unix-shell, sériové spracovanie

UNIX príkazy z R prostredníctvom funkcie shell - r, bash, rstudio, knitr, git-bash

ako zavolať program COBOL prostredníctvom shell skriptu [duplicate] - linux, bash, shell, unix, cobol

Vyhľadávanie textového súboru v systéme Unix pomocou shell skriptu - linux, bash, shell, awk, sh

Jenkins: špeciálne znaky vložené do skriptu bash - linux, bash, shell, hudson, jenkins

Ako spustiť shell skript bez písania bash (chyba bash príkazu: mapfile nenájdený) - linux, bash, shell, unix

Linux 'cut' príkazový riadok a nahradiť - linux, bash, shell, unix

Ukladanie výstupu textu v premenných (bash) - linux, bash, shell, unix

Komunikácia medzi jadrom a shellom - linux, shell, operačný systém

Program Java (trieda> .jar) ako shell Unix (namiesto sh / bash)? - java, bash, shell, unix, exec

skript bash vykonaný httpd nečíta používateľské premenné prostredia - bash, apache, amazon-ec2

rozdeliť súbor na segmenty? - bash, súbor, text, rozdelenie

Unix skriptovanie - Hľadanie minimálneho a maximálneho (Bash Shell) - bash, shell, unix, skriptovanie

ako spustiť 2 alebo viac skriptov bash / unix paralelne [duplicitné] - bash, shell, unix, paralelné spracovanie

Sublime 3 - Pridajte špeciálne zvýraznenie syntaxe pluginov pre žiadny typ súboru - bash, shell, sublimetext3