/ / Cloudera 5.6: Parkiet nie obsługuje daty. Zobacz HIVE-6384 - ul, cloudera, parkiet

Cloudera 5.6: Parkiet nie obsługuje daty. Zobacz HIVE-6384 - ul, cloudera, parkiet

Obecnie używam Cloudera 5.6, próbując utworzyć tabelę formatu parkietu w tabeli ula na podstawie innej tabeli, ale mam błąd.

create table sfdc_opportunities_sandbox_parquet like
sfdc_opportunities_sandbox STORED AS PARQUET

Komunikat o błędzie

Parquet does not support date. See HIVE-6384

Czytałem, że ul 1.2 ma naprawę dla tego problemu, ale Cloudera 5.6 i 5.7 nie pochodzą z gałęzi 1.2. Czy ktoś znalazł sposób obejścia tego problemu?

Odpowiedzi:

2 dla odpowiedzi № 1

Oprócz użycia innego typu danych, takiego jak ZNAK CZASU lub inny format przechowywania, na przykład ORCmoże nie być żadnej drogi, jeśli istnieje zależność od użytej wersji Hive i formatu przechowywania plików Parquet.

Według Clouderasa Informacje o opakowaniach i tarballie CDH 5, cała gałąź 5 jest zapakowana Parkiet Apache w wersji 1.5.0 i Apache Hive w wersji 1.1.0.

Data została zaimplementowana w ParquetSerde z HIVE-8119 i od Hive 1.2.