To jest moja ramka danych
X color cut carrat
1 E Ideal 0.23
2 J Premiun 0.34
3 E Ideal 0.23
...
Chcę utworzyć wykres pola mojej kolumny var „cut”.
Oto kod tego, co chcę zrobić ...
ggplot(diamonds, aes(cut)) + geom_boxplot()
Jednak to nie działa poprawnie, ponieważ brakuje w niej estetyki var "y".
To dlatego, że nie dostarczam drugiego var doaes, co to jest druga var, którą muszę dostarczyć? Ponieważ potrzebuję tylko na krawędzi x różnych wartości, które może przyjąć moja „skrawka” var i na krawędzi Y to jej częstotliwość.
Dzięki.
Odpowiedzi:
1 dla odpowiedzi № 1Boxplot potrzebuje zmiennej y, ponieważ ilustruje dystrybucję. Liczba rzędów po cięciu nie będzie rozkładem, lecz tylko jedną liczbą na cięcie. Oto liczby każdego cięcia:
> table(diamonds$cut)
Fair Good Very Good Premium Ideal
1610 4906 12082 13791 21551
Ta informacja nie może być pokazana na wykresie pudełkowym. Zamiast tego możesz użyć wykresu słupkowego w następujący sposób:
ggplot(diamonds, aes(x = cut)) +
geom_bar()
Który produkuje ten wykres:
Albo na przykład kod boxplota cięcia i karata, na przykład:
ggplot(diamonds, aes(x = cut, y = carat)) +
geom_boxplot()
A wykres:
Zatem boxplot pokazuje średnią, zakres i kwartyle kolumny karatowej według każdego poziomu cięcia.
1 dla odpowiedzi nr 2
Poniższy kod wykona zadanie:
library(ggplot2)
p <- ggplot(diamonds, aes(x = cut, y=carat))
p <- p + geom_boxplot(outlier.colour = "blue", fill="grey85")
p <- p + labs(title = "Diamonds carats")
show(p)
Boxplot to grupowanie niektórych dystrybucji danych, dlatego musisz podać dane, których dystrybucja chcesz wykonać. The x
estetyka musi reprezentować typ, y
musi reprezentować zestaw danych.