Estou usando o Datastax para Cassandra e em cima deO CFS, estou tentando carregar os dados usando o Hive.Cassandra com TTL (tempo de vida) no nível da coluna durante a inserção e a atualização. Minha pergunta é como podemos obter o mesmo TTL quando carregamos os dados usando o Hive na família de colunas. Existe alguma maneira de especificar o TTL para ColumnFamily ou durante o carregamento da seção?
Exemplo (ref do site do datatax): cqlsh: demodb> INSERT INTO usuários (usuário senha) VALORES ("cbrown", "ch @ ngem4a") USANDO TTL 86400;
cqlsh: demodb> ATUALIZAR usuários USANDO TTL 432000 SET "password" = "ch @ ngem4a" WHERE nome_do_usuário = "cbrown";
Nota: o requisito é limpar os dados após um período de tempo. Cassandra tendo a opção de fazer isso usando TTL, mas estou tentando carregar os dados usando o Hive.Então, procurando uma opção para especificar TTL na coluna Nível da família ou durante o carregamento via hive
Respostas:
1 para resposta № 1A leitura de dados do CF usando o Hive exclui colunas expiradas. A gravação de dados na família de colunas não pode especificar TTL no HIVE. Adicionaremos esta função em breve.
Mas você pode fazê-lo no Pig especificando TTL no output_query ou no Hadoop configurando TTL em "cassandra.output.cql"