Pomoc w programowaniu, odpowiedzi na pytania / Pyton / Python: Parsuj duży plik json - python, json

Python: Parsuj duży plik json - python, json

Mam duży plik json. Jego dane dziennika i skompresowałem je do formatu bz2 (myfile.json.bz2). Rozmiar pliku bz2 wynosi 90 MB. Szukałem dobrego rozwiązania lub posta na blogu, który wyjaśniłby efektywne analizowanie skompresowanego pliku bz2 json, ale nie był w stanie go znaleźć.

Ponieważ plik jest duży, wykonanie czegoś takiego jest niemożliwe.

with open("data.json") as data_file:
data = json.load(data_file)

jakie jest najlepsze podejście?

Po kilku kopaniu znalazłem pakiet python do odczytu bz2

input_file = bz2.BZ2File(filename, "r")

Odpowiedzi:

1 dla odpowiedzi № 1

W przypadku braku innych sugestii lub istniejącego kodu polecam otwarcie strumienia i ręczne analizowanie nawiasów klamrowych i nawiasów ({ i [ odpowiednio), dopóki nie masz kompletnego obiektu { ... } i uruchom w tym celu deserializację. Umożliwi to porcjowanie JSON przy jednoczesnym wykorzystaniu istniejących bibliotek JSON.

Nie jest to rozwiązanie, które zazwyczaj polecam, ale jest to najszybsze i najbardziej niezawodne rozwiązanie, jakie mogę wymyślić, jeśli istniejące biblioteki nie odpowiadają twoim potrzebom.

Powiązane pytania

Python - który jest szybszy do analizy Json lub XML? [zamknięty] - python, xml, json, xml-parsing

Jaki jest najlepszy sposób na załadowanie dużych list JSON w Pythonie? - python, json, duże pliki

Python json parsuje bardzo duże pliki - python, json

jak czytać json.txt i parsować json python CZYTAJ TXT PYTHON - python, json

python nieobsługiwany wyjątek - python, scripting, xml-parsing

Jak parsować plik WIkidata JSON (.bz2) za pomocą Pythona? - python, json, wikidata, bz2

Czytanie raczej dużych plików json w Pythonie [duplicate] - python, json

Jak mogę parsować ciąg JSON i wydrukować go za pomocą Pythona na Linuksie? - python, json, linux

Sekwencja plików json zmienia się po wywołaniu metody json.load - python, json

Python, aby otrzymać ogromny ciąg znaków jako argument z rabbitmq - python, json, rabbitmq, pickle

Jak uzyskać niezawodny dostęp do pojedynczej pary klucz-wartość z pliku JSON, który jest zbyt duży, aby załadować go do pamięci? - python, python-3.x

Jak odróżnić dwa różne typy plików w python 2.7? - python, python-2.7, file-io

Parsowanie listy Pythona za pomocą PHP - php, python, json

Parsowanie JSON do MYSQL Python 3 - mysql, json, python-3.x

plik drzewa json, adres url do pliku csv za pomocą pythona [closed] - json, python-2.7

Python modyfikuje plik .bak - json, python-2.7

Discord Bot - kod skryptu Java do Pythona - javascript, python, discord

JSON.parse bez ucieczki [duplikat] - javascript, python, json

Jak obliczyć strukturę dużego pliku JSON z Węzłem? - javascript, json, node.js

javascript String do JSON? - javascript, json