/ / Intervalli di confidenza per la regressione della cresta - r, regressione, glmnet

Intervalli di confidenza per la regressione della cresta - r, regressione, glmnet

Non posso fare gli intervalli di confidenza in una regressione della cresta. Ho questo modello.

model5 <- glmnet(train_x,train_y,family = "gaussian",alpha=0, lambda=0.01)

E quando faccio la predizione io uso questi comandi:

test_pred <- predict(model5, test_x, type = "link")

Qualcuno sa come fare l'intervallo di confidenza per le previsioni?

risposte:

4 per risposta № 1

Si scopre che glmnet non offre errori standard (e quindi non ti dà intervalli di confidenza) come spiegato Qui e anche affrontato in questo vignetta (estratto sotto):

È una domanda molto naturale chiedere gli errori standard di regressione coefficienti o altre quantità stimate. In linea di principio tale standard gli errori possono essere facilmente calcolati, ad es. usando il bootstrap.

Eppure, questo pacchetto deliberatamente non fornisceloro. La ragione di questo è che gli errori standard non sono molto significativi per un orientamento fortemente distorto stime come derivano da metodi di stima penalizzati. penalizzato la stima è una procedura che riduce la varianza degli stimatori di introducendo pregiudizi sostanziali. Il bias di ogni stimatore è quindi a componente principale del suo errore quadratico medio, mentre la sua varianza potrebbe contribuire solo una piccola parte.

Sfortunatamente, nella maggior parte delle applicazioni di penalizzatiregressione è impossibile ottenere un sufficientemente preciso stima del pregiudizio. Qualsiasi calcolo basato sul bootstrap può solo dare una valutazione della varianza delle stime. Stime affidabili di il bias è disponibile solo se sono stime affidabili e imparziali disponibile, che in genere non è il caso in situazioni in cui vengono utilizzate stime penalizzate.

Segnalazione di un errore standard di a penalizzatistima quindi dice solo una parte della storia. Può dare un'impressione errata di grande precisione, ignorando completamente il inesattezza causata dal pregiudizio. È certamente un errore da fare dichiarazioni di fiducia che si basano solo su una valutazione del varianza delle stime, come la fiducia basata sul bootstrap gli intervalli fanno.

Intervalli di confidenza affidabili intorno alpenalizzati le stime possono essere ottenute nel caso di modelli a bassa dimensionalità che utilizzano la teoria del modello lineare generalizzato standard implementata in lm, glm e coxph. Metodi per costruire intervalli di confidenza affidabili in a mia conoscenza, la situazione ad alta dimensione non è disponibile.

Tuttavia, se insisti su intervalli di confidenza, controlla Questo inviare.