プログラミングの助け、質問への回答 / バッシュ /コンテンツに基づいて入力を複数の出力に分割しますか？ -bash、unix、shell、text

コンテンツに基づいて複数の出力に分割しますか？ - bash、unix、shell、text

次のようなファイルがあるとしましょう：

xxxx aa whatever
yyyy bb whatever
zzzz aa whatever

次の内容を含む2つのファイルに分割します。

最初：

xxxx aa whatever
zzzz aa whatever

二番目：

yyyy bb whatever

つまり行のいくつかの値に基づいて行をグループ化します（ルールは次のとおりです：スペースで区切られた2番目の単語）。ただし、グループ内の行を並べ替えないでください。

もちろん、それを行うためのプログラムを書くことはできますが、このようなことができる準備ができているツールがあるかどうか疑問に思っています。

申し訳ありませんが、私はそれを想定していなかったため、言及しませんでした。かなり明白-さまざまな「単語」の数は膨大です。それらのうち少なくとも10000について話している。つまり事前の単語の列挙に基づく解決策は機能しません。

また、マルチパススプリットはあまり好きではありません。問題のファイルは通常かなり大きくなります。

回答：

回答№1は6

次の名前のファイルが作成されます output.aa, output.bb等：

awk "{print >> "output." $2}" input.file

回答№2の場合は1

そうですね、grepを実行して一致する行を取得し、grep -vを実行して一致しない行を取得することができます。

うーん、できるよ sort -f" " -s -k 2,2、しかしそれはO（n log n）です。

関連する質問

Unix環境用のソースコード 'cd'コマンド - unix、chdir

パテのプロンプトを変更する方法 - unix、shell、prompt

行数に基づいてテキストまたはcsvファイル（100,000）をcsvファイルに分割する方法（それぞれに10kが含まれています） - シェル、unix

Unixシェルスクリプトについて - shell、unix

awkを使ったシェルスクリプトの複数の引数 - shell、unix、awk

シェルスクリプトを使用して、unix-shellでcommand1の完了後にcommand2を実行します。

Rからシェル関数経由のUNIXコマンド - r、bash、rstudio、knitr、git-bash

シェルスクリプトを使ってCOBOLプログラムを呼び出す方法[複製] - linux、bash、shell、unix、cobol

シェルスクリプトを使ってUnixのテキストファイルを検索する - linux、bash、shell、awk、sh

ジェンキンス：bashスクリプトに挿入される特殊文字 - linux、bash、shell、hudson、jenkins

bash（bashコマンドエラー：mapfileが見つかりません）を入力せずにシェルスクリプトを実行する方法 - linux、bash、shell、unix

Linux 'cut'コマンドラインと置き換え - linux、bash、shell、unix

テキスト出力を変数に格納する（bash） - linux、bash、shell、unix

カーネルとシェル間の通信 - Linux、シェル、オペレーティングシステム

Unixシェル（sh / bashの代わりに）としてのJavaプログラム（クラス> .jar）？ - java、bash、shell、unix、exec

httpdによって実行されるbashスクリプトは、ユーザー環境変数 - bash、apache、amazon-ec2を読み取らない

ファイルをセグメントに分割しますか？ - bash、ファイル、テキスト、分割

Unixスクリプト - 最小値と最大値の検索（Bashシェル） - bash、shell、unix、scripting

2つ以上のbash / unixスクリプトを並行して実行する方法[複製] - bash、shell、unix、parallel-processing

崇高な3 - 特定のプラグインのシンタックスハイライトをファイルタイプなしに追加する - bash、shell、sublimetext3