Aiuto nella programmazione, risposte alle domande / parsing / Il modo migliore per memorizzare i token durante lo stage di lexing: analisi, compilazione del compilatore, parsing xml, token, lexer

Il modo migliore per memorizzare i token durante lo stage di lexing: analisi, compilazione del compilatore, parsing xml, token, lexer

Ciao sto implementando attualmente un lexerinterrompe i file XML in token, sto considerando modi di passare i token su un parser per creare una struttura di dati più utile da detti token - il mio piano attuale è archiviarli in un arraylist e passarli al parser, sarebbe un elenco di link in cui ogni token punta al prossimo è più adatto? O è in grado di accedere a token per indice più facile da fare un parser o è tutta una strategia terribile?

Anche se qualcuno ha usato antlr, so che usa unflusso di token per passare l'input token al parser, come può il parser prendere decisioni se l'input è valido / creare una struttura di dati se non ha ancora tutti i token dall'input?

Qualsiasi commento / opinione benvenuto, grazie!

risposte:

2 per risposta № 1

L'architettura più comune per questo tipo di parser, per eseguire il lexer all'interno del parser. Ogni volta che ti serve un token, effettua una chiamata a una funzione (da lexer) che recupera quella successiva.

Non conosco Antlr, ma penso che tutti usino lo stesso: quello che sto proponendo è come funzionano lo yacc e lex.

domande correlate

Problemi di ScintillaNET in VB.NET - vb.net, scintilla

Come istanziare lexical.Scanner in una classe JavaTokenParsers? - scala, analisi, analisi lessicale

I metodi dovrebbero modificare le variabili di istanza in Ruby? - rubino

Le relazioni tra Language, Compiler, Regular Expression, Lessical Analysis e Parsing [closed] - regex, compilazione-compilazione, compilazione, analisi lessicale

gestione degli errori di lexer PLY Python - python, gestione degli errori, lexer, ply

Prolog: semplice lexer / 2 - prolog, dcg

Perché la T in PHP è inaspettata T_VARIABLE - php

"Analizza" un sottoinsieme di "compilazione"? - analisi, costruzione del compilatore, terminologia

Quale sarebbe la corretta classificazione dei metodi di analisi nella progettazione del compilatore? - analisi, compilazione, costruzione del compilatore, discesa ricorsiva, backtracking ricorsivo

ANTLR: aiuto su Lexing Errors per un esempio di grammatica personalizzata: analisi, antlr, antlr4

ANTLR4: due canali, uno per i dati in formato CSV, uno per i dati in formato chiave / valore, non funziona: analisi, csv, antlr, antlr4, analisi lessicale

Perché questo semplice jparsec lexer fallisce? - java, parsing, tokenize, lexer, jparsec

Dovrei usare un lexer quando uso una libreria di parser combinator come Parsec? - haskell, lexer, parsec

Esistono soluzioni off-the-shelf per l'analisi lessicale in Haskell che consentono un lessico dinamico run-time? - haskell, nlp, analisi lessicale, alex

come restituire qualcosa quando non c'è corrispondenza in flex (lexer) - flex-lexer

Nomenclatura di analisi e compilazione - c ++, c, analisi, creazione, nomenclatura

come posso creare una tabella di verità in turbo c [chiuso] - c, analisi, parser-generator, turbo-c, attendibile

char cambia sempre usando flex [duplicate] - c, visual-studio, char, flex-lexer, lex

Come consumare il testo fino a newline in ANTLR? - antlr

Commutare CommonTokenStream per ignorare o abilitare Whitespace - antlr4