Ajuda na programação, respostas a perguntas / Python / Python: Analisar arquivo json grande - python, json

Python: Analisar arquivo json grande - python, json

Eu tenho um arquivo json grande. Seus dados de log e eu o compactei no formato bz2 (myfile.json.bz2). O tamanho do arquivo bz2 é de 90MB. Eu procurei para encontrar uma boa solução ou uma postagem no blog que explica a análise do arquivo bz2 json comprimido de forma eficiente, mas não foi capaz de encontrar nenhum.

Como o arquivo é grande, é impossível fazer algo do tipo.

with open("data.json") as data_file:
data = json.load(data_file)

Qual é a melhor abordagem?

Depois de algumas pesquisas, descobri que há um pacote python para ler bz2

input_file = bz2.BZ2File(filename, "r")

Respostas:

1 para resposta № 1

Na ausência de qualquer outra sugestão ou código existente, eu recomendaria abrir um fluxo e analisar manualmente as chaves e colchetes ({ e [ respectivamente) até que você tenha um objeto completo { ... } e execute a desserialização nisso. Isso permitirá que você segmente o JSON enquanto aproveita as bibliotecas JSON existentes.

Esta não é uma solução que eu normalmente recomendaria, mas é a solução mais rápida e confiável em que posso pensar se as bibliotecas existentes não atenderem às suas necessidades.

Perguntas relacionadas

Python - Qual é o mais rápido para analisar Json ou XML? [fechado] - python, xml, json, xml-parsing

Qual é a melhor maneira de carregar grandes listas JSON no Python? - python, json, arquivos grandes

Python json analisando arquivos muito grandes - python, json

como ler json.txt e analisar python json LEIA TXT PYTHON - python, json

exceção não tratada de python - python, scripts, xml-parsing

Como analisar o arquivo WIkidata JSON (.bz2) usando Python? - python, json, wikidata, bz2

Lendo arquivos json bastante grandes em Python [duplicado] - python, json

Como posso analisar a string JSON e imprimi-la usando o Python no linux? - python, json, linux

Seqüência de alterações no arquivo json ao invocar o método json.load - python, json

Python para receber uma string enorme como argumento de rabbitmq - python, json, rabbitmq, pickle

Como posso acessar de forma confiável um único par de valores-chave a partir de um arquivo JSON que seja grande demais para ser carregado na memória? - python, python-3.x

Como diferenciar entre dois tipos diferentes de arquivos no python 2.7? - python, python-2.7, file-io

Parsing lista Python com PHP - php, python, json

Analisando JSON para MYSQL Python 3 - mysql, json, python-3.x

Arquivo json tree, url para o arquivo csv usando python [closed] - json, python-2.7

Python modificar arquivo .bak - json, python-2.7

Discord Bot - código de script Java para Python - javascript, python, discord

JSON.parse sem escapar [duplicado] - javascript, python, json

Como descobrir a estrutura de um arquivo JSON grande com o Node? - javascript, json, node.js

JavaScript String para JSON? - javascript, json