/ Ako rozdeliť riadok na Thorn znak "þ" v linuxe? - linux, awk, string-split

Ako rozdeliť riadok na Thorn znak "þ" v linux? - linux, awk, string-split

Ako rozdeliť riadok na Thorn znak "þ" v Linuxe?

Snažil som sa nasledovné

awk -F "þ" "{print $2}"
awk -F "xC3xBEx02" "{print $2}"
awk -F "þ" "{print $2}"

nič nefungovalo.

EDIT: Súbor sa nachádza v režime HDFS (Hadoop File System) nasledujúci príkaz pracuje na príkazovom riadku, ale nie v shellovom skripte (keď sa vykoná shell shell, dáva prázdny výstup, tzn.

Príkazový riadok:

~/etltestsar/DoubleClick$ hadoop fs -cat /raw/doubleclick/data/dt=2015-03-30/NetworkMatchtablesActivity_7657_03-30-2015_advertiser.log.gz|gunzip|tail -n +2|awk -F "þ" "
Warning: $HADOOP_HOME is deprecated.

3848762
3963771
4112862
4140939
4199580
4199584
.....

Rovnaký príkaz v shellovom skripte nevytvára žiadny výstup

hadoop@node28-19-88:~/etltestsar/DoubleClick$ sh testthorn.sh
Warning: $HADOOP_HOME is deprecated.

odpovede:

1 pre odpoveď č. 1

Získajte iný awk? GNU awk 4.1.1 v bash 4.1.17 (9) na cygwin:

$ cat file
fooþbar

$ awk -F "þ" "{print $2}" file
bar