/ / Jak drukować częstotliwość na boxplocie - ggplot - R - r, ggplot2, boxplot

Jak wydrukować częstotliwość na boxplot - ggplot - R - r, ggplot2, boxplot

To jest moja ramka danych

X color   cut      carrat
1   E    Ideal     0.23
2   J    Premiun   0.34
3   E    Ideal     0.23
...

Chcę utworzyć wykres pola mojej kolumny var „cut”.

Oto kod tego, co chcę zrobić ...

ggplot(diamonds, aes(cut)) + geom_boxplot()

Jednak to nie działa poprawnie, ponieważ brakuje w niej estetyki var "y".

To dlatego, że nie dostarczam drugiego var doaes, co to jest druga var, którą muszę dostarczyć? Ponieważ potrzebuję tylko na krawędzi x różnych wartości, które może przyjąć moja „skrawka” var i na krawędzi Y to jej częstotliwość.

Dzięki.

Odpowiedzi:

1 dla odpowiedzi № 1

Boxplot potrzebuje zmiennej y, ponieważ ilustruje dystrybucję. Liczba rzędów po cięciu nie będzie rozkładem, lecz tylko jedną liczbą na cięcie. Oto liczby każdego cięcia:

> table(diamonds$cut)

Fair      Good Very Good   Premium     Ideal
1610      4906     12082     13791     21551

Ta informacja nie może być pokazana na wykresie pudełkowym. Zamiast tego możesz użyć wykresu słupkowego w następujący sposób:

ggplot(diamonds, aes(x = cut)) +
geom_bar()

Który produkuje ten wykres:

wykres słupkowy

Albo na przykład kod boxplota cięcia i karata, na przykład:

ggplot(diamonds, aes(x = cut, y = carat)) +
geom_boxplot()

A wykres:

boxplot

Zatem boxplot pokazuje średnią, zakres i kwartyle kolumny karatowej według każdego poziomu cięcia.


1 dla odpowiedzi nr 2

Poniższy kod wykona zadanie:

library(ggplot2)
p <- ggplot(diamonds, aes(x = cut, y=carat))
p <- p + geom_boxplot(outlier.colour = "blue", fill="grey85")
p <- p + labs(title = "Diamonds carats")
show(p)

Boxplot to grupowanie niektórych dystrybucji danych, dlatego musisz podać dane, których dystrybucja chcesz wykonać. The x estetyka musi reprezentować typ, y musi reprezentować zestaw danych.

wprowadź opis obrazu tutaj