/ / albero decisionale e rete neurale per set di dati: machine-learning, rete neurale, dataset, weka, albero decisionale

albero decisionale e rete neurale per dataset - machine-learning, rete neurale, dataset, weka, albero decisionale

Sto osservando quali sono i pro e i contro dell'usosia un albero delle decisioni che una rete neurale per un set di dati. Ho cercato su Internet cercando di trovare delle risposte, ma tutto quello che mi sembra di trovare sono i pro e i contro di ciascuno nel quadro generale. Fondamentalmente sto cercando di capire perché un albero decisionale e una rete neurale andrebbero bene per un set di dati particolare. Suppongo che se il set di dati è grande o piccolo, valori anomali e dati mancanti potrebbero influire sull'utilizzo preciso o meno accurato di alberi decisionali o reti neurali. Grazie in anticipo

risposte:

0 per risposta № 1

Ecco come penso alla scelta del modello di apprendimento automatico:

1) Le reti neurali sono le più flessibili, che possono essere buone o cattive. Per le attività in cui si hanno milioni di esempi di allenamento, una rete neurale generalmente funzionerà al meglio.

2) Se hai pochi esempi di allenamento (come, forse10 o meno esempi di allenamento per dimensione del tuo vettore di funzionalità), quindi una rete neurale sarà a rischio di sovralimentazione. Un modello con meno flessibilità, come l'albero decisionale o l'ingenuo Bayes, potrebbe fare un lavoro migliore. Tuttavia, in questi casi è ancora possibile utilizzare una rete neurale se si regolano con attenzione i metaparametri per ridurre il sovradattamento.

3) Se hai pochi esempi di allenamento, ANDil fenomeno sottostante che stai cercando di modellare è troppo complicato per modellarlo con limiti decisionali semplici, quindi nessuno dei modelli generici funzionerà bene, tuttavia, se hai una conoscenza a priori del fenomeno (ad esempio se conosci la forma della fisica equazione che lo descrive), quindi è possibile creare il proprio modello personalizzato e formarne i parametri sconosciuti con la discesa del gradiente.

Il corso di apprendimento automatico gratuito di Andrew Ng è una buona risorsa che parla di alcune delle regole empiriche e dell'intuizione per il sovradattamento e la scelta del modello.