Pomoc w programowaniu, odpowiedzi na pytania / r / Jak wykreślić przedziały ufności dla dopasowania osi głównej przy użyciu pakietu smatr w R? - r, przedział ufności

Jak wykreślić przedziały ufności dla dopasowania osi głównej przy użyciu pakietu smatr w R? - r, przedział ufności

Dopasowuję SMA do danych allometrycznych za pomocą smatr pakowanie w R, i mam trudności w wykreślaniu 95% przedziałów ufności obliczonych przez sma() dowództwo.

Biorąc przykładowe dane w dokumentacji pakietu, w jaki sposób dodać górne i dolne 95% linie zaufania do wykresu danych xy i dopasowania SMA?

# Load leaf lifetime dataset:
data(leaflife)

# Fit SMA
ft <- sma(longev~lma, data=leaflife, log="xy", method="SMA")

#plot data and fit
plot(ft, log="xy")

Jak teraz dodawać linie do 95% przedziałów ufności na moim wykresie?

Dziękuję Ci!

Odpowiedzi:

1 dla odpowiedzi № 1

Ostatnio miałem ten problem, a pakiet smatr nie zwraca przedziałów ufności wokół prognoz.

Jednak można to osiągnąć poprzezładowanie początkowe, w którym przypadkowe zestawy danych są wykonywane w tym samym modelu, który pasuje do nich. Wyodrębnienie wszystkich przechwyceń i nachyleń pozwala uzyskać 95% przedziały ufności wokół swoich przewidywań.

Prawdopodobnie istnieje wiele sposobów, aby to zrobić, ale zrobiłem to za pomocą tidyverse. To wykorzystuje pakiety model, purrr, dplyr itd. O wiele więcej linii kodu wolałbym, więc jeśli ktoś ma bardziej eleganckie rozwiązania, daj mi znać.

Log10 transformuję przed uruchomieniem modelu, ponieważ ułatwia to wykreślenie punktów i prognoz w ggplot2.

# smatr bootstrap example

# load packages
library(smatr)
library(dplyr)
library(purrr)
library(tidyr)
library(ggplot2)

# load data
data(leaflife)

# make columns log scale
leaflife <- mutate(leaflife, log_longev = log10(longev),
log_lma = log10(lma))

# fit sma
mod <- sma(log_longev ~ log_lma, data=leaflife, method="SMA")

# plot model
plot(mod)

# create new data set of log_lma at a high resolution (200 points from min to max)
preds <- data.frame(expand.grid(log_lma = seq(min(leaflife$log_lma, na.rm = T), max(leaflife$log_lma, na.rm = T), length.out = 200), stringsAsFactors = FALSE))

# bootstrap data and get predictions
preds <- leaflife %>%
# create new bootstrapped data sets
modelr::bootstrap(n = 1000, id = "boot_num") %>%
# fit sma to every bootstrap
group_by(boot_num) %>%
mutate(., fit = map(strap, ~ sma(log_longev ~ log_lma, data=data.frame(.), method="SMA"))) %>%
ungroup() %>%
# extract intercept and slope from each fit
mutate(., intercept = map_dbl(fit, ~coef(.x)[1]),
slope = map_dbl(fit, ~coef(.x)[2])) %>%
select(., -fit) %>%
# get fitted values for each bootstrapped model
# uses the preds dataframe we made earlier
group_by(boot_num) %>%
do(data.frame(fitted = .$intercept + .$slope*preds$log_lma,
log_lma = preds$log_lma)) %>%
ungroup() %>%
# calculate the 2.5% and 97.5% quantiles at each log_lma value
group_by(., log_lma) %>%
dplyr::summarise(., conf_low = quantile(fitted, 0.025),
conf_high = quantile(fitted, 0.975)) %>%
ungroup() %>%
# add fitted value of actual unbootstrapped model
mutate(., log_longev = coef(mod)[1] + coef(mod)[2]*log_lma)

# plot with ggplot
ggplot(leaflife, aes(log_lma, log_longev)) +
geom_point() +
geom_line(data = preds) +
geom_ribbon(aes(ymin = conf_low, ymax = conf_high), alpha = 0.1, preds) +
theme_bw()

To daje ten wątek