Ako rozdeliť riadok na Thorn znak "þ" v Linuxe?
Snažil som sa nasledovné
awk -F "þ" "{print $2}"
awk -F "xC3xBEx02" "{print $2}"
awk -F "þ" "{print $2}"
nič nefungovalo.
EDIT: Súbor sa nachádza v režime HDFS (Hadoop File System) nasledujúci príkaz pracuje na príkazovom riadku, ale nie v shellovom skripte (keď sa vykoná shell shell, dáva prázdny výstup, tzn.
Príkazový riadok:
~/etltestsar/DoubleClick$ hadoop fs -cat /raw/doubleclick/data/dt=2015-03-30/NetworkMatchtablesActivity_7657_03-30-2015_advertiser.log.gz|gunzip|tail -n +2|awk -F "þ" "
Warning: $HADOOP_HOME is deprecated.
3848762
3963771
4112862
4140939
4199580
4199584
.....
Rovnaký príkaz v shellovom skripte nevytvára žiadny výstup
hadoop@node28-19-88:~/etltestsar/DoubleClick$ sh testthorn.sh
Warning: $HADOOP_HOME is deprecated.
odpovede:
1 pre odpoveď č. 1Získajte iný awk? GNU awk 4.1.1 v bash 4.1.17 (9) na cygwin:
$ cat file
fooþbar
$ awk -F "þ" "{print $2}" file
bar