Pomoc w programowaniu, odpowiedzi na pytania / Hadoop / ClassCastException podczas używania formatu pliku ORC z Hive, gdy vectorized.execution.enabled - hadoop, mapreduce, hive

Wyjątek ClassCastException podczas używania formatu pliku ORC z Hive, gdy vectorized.execution.enabled - hadoop, mapreduce, hive

Mam tabelę gałęzi z następującymi właściwościami -

Format przechowywania ORC
transakcyjny = true
Partycjonowany na 4 klucze - rok, miesiąc, dzień, godzina
zebrane przez groupingKey

Używam Hive Streaming do zapełniania danych bezpośrednio do tabeli.

Teraz mój problem jest - Próbuję uruchomić następujące zapytanie

select count(*) from table_name;

Dostaję następujący wyjątek

Caused by: java.lang.ClassCastException:    org.apache.hadoop.hive.ql.io.orc.OrcStruct$OrcStructInspector cannot be cast to org.apache.hadoop.hive.serde2.objectinspector.PrimitiveObjectInspector
at org.apache.hadoop.hive.ql.exec.vector.VectorizedBatchUtil.setVector(VectorizedBatchUtil.java:295)
at org.apache.hadoop.hive.ql.exec.vector.VectorizedBatchUtil.acidAddRowToBatch(VectorizedBatchUtil.java:275)
at org.apache.hadoop.hive.ql.io.orc.VectorizedOrcAcidRowReader.next(VectorizedOrcAcidRowReader.java:82)

Jednak jeśli wyłączę wektorową realizację, ustawiając następującą właściwość

set hive.vectorized.execution.enabled = false;

wszystko działa dobrze (chociaż ukończenie trwa kilka wieków).

Dlaczego to się dzieje ? Z tego, co rozumiem, w formacie ORC, powinno działać wektoryzowane wykonanie.

Wersja Hadoop - 2.7.1

Wersja Hive - 1.2.1

Odpowiedzi:

1 dla odpowiedzi № 1

Wygląda na to, że ten problem z ulem został zamknięty / naprawiony. sprawdź ponownie używaną wersję ula.

Proszę sprawdzić Vectorized wykonanie powoduje ClassCastException

Powiązane pytania

Apache Hive w 32-bitowym systemie operacyjnym - Windows-7, hadoop, cygwin, hive

Budowa Apache Hive - niemożliwe do rozwiązania zależności - java, mrówka, hadoop, bluszcz, ul

Hadoop 2.4: java.lang.NoClassDefFoundError: org / apache / hcatalog / mapreduce / InputJobInfo - java, hadoop, hive, hcatalog

HIVE: Dlaczego Hive generuje zadanie mapreduce w wybranej kolumnie z nazwy tablic Vs nie generującej mapreduce dla select * from tablename? - ul

java.lang.ClassCastException: org.apache.hadoop.io.Text nie można przesłać do org.apache.hadoop.hive.ql.io.orc.OrcSerde $ OrcSerdeRow - hive, hiveql

Orc nie szybciej niż csv w Hive? - hadoop, ul, ork

Hive - Czy można uzyskać całkowity rozmiar części plików w katalogu? - hadoop, hive, hdfs, hiveql, hive-udf

co mogę zrobić razem z hadoopem i elastycznymi poszukiwaniami? - Miaoop, elastyczne wyszukiwanie

Błąd wykonania, kod powrotu 2 z org.apache.hadoop.hive.ql.exec.mr.MapRedTask - hadoop, hive, mapreduce, hadoop2

Jak włączyć sygnaturę czasową w Hive - hadoop, timestamp, hive, cloudera, create-table

jaka jest różnica między Hive a Cascading Lingual - hadoop, hive, cascading

XML Serde dla Hadoop / Hive - hadoop, ul

Hive - utwórz tabelę z pliku zip - hadoop, hive, hdfs

Czy mogę użyć funkcji llap z ulem 1.2.1000 w hdp 2.6? - hadoop, ul

Hive lub Hbase, kiedy musimy pobrać większą liczbę kolumn? - hadoop, ula, hbase

Integracja Cassandry z Hadoop - hadoop, cassandra, nosql, ul, integracja

Problemy podczas próby załadowania usługi hwi w hive-1.1.0? - hadoop, ul

W klastrze hadoop, czy powinien on być zainstalowany na wszystkich węzłach? - hadoop, klastry komputerowe, ul

Dlaczego zginęła praca związana z mapą ula? - hadoop, mapreduce, ul, odcień

Czy w hive uruchamianie hadoop po wykonaniu kwerendy? - baza danych, hadoop, ul