Допомога у програмуванні, відповіді на питання / Unix / hive і unix scripting - unix, hadoop, hive

сценарії вулика та уніксу - unix, hadoop, вулик

Я маю csv файл і CTL з інформацією про файл, як імена стовпців, розмір, кількість рядків, місце розташування

Я повинен завантажити це вулик і створити файл ctl для таблиці кущів

і перевірте, чи збігається файл ctl чи ні

Я маю намір написати bash script для вилучення інформації таблиці таблиць з команди «кущ» "описувати форматовану таблицю" і створення іншого ctl-файлу і порівняння обох файлів CTl.

не впевнений у синтаксисі сценаріїв, але я думаю, що це можна досягти

чи є інший спосіб отримання інформації про таблицю кущів? або інший спосіб для всього підходу

Відповіді:

0 для відповіді № 1

Щоб отримати лише назви стовпців

hive -e "describe <table_name>"|awk -F" " "{ print $1 }"

Якщо потрібно перенаправити файл

hive -e "describe <table_name>"|awk -F" " "{ print $1 }" >> describe.txt

0 для відповіді № 2

1) надати повну інформацію про CTLфайл. 2) синтаксичний аналіз ctl-файлу csv і створення таблиці на основі вулик 3) з використанням того ж самого синтаксичного аналізатора створюють таблицю B з іншою ctl таблицею 4) виконання "опису форматованої таблиці A і таблиці B шляхом видалення записів, таких як CreateTime: LastAccessTime Location і помістіть його у файл 5) знайти відмінність кожного файлу

можливо, якщо ви можете дати більш детальну інформацію про те, як файли є прикладом, ми можемо підготувати bash-скрипти для його автоматизації.

вкажіть тут назву таблиці desc, щоб дати вам скрипт bash, щоб отримати імена стовпців