Pomoc w programowaniu, odpowiedzi na pytania / Pandy / Jak wykreślić histogram przedziałów czasowych za pomocą pand? - pandy

Jak wykreślić histogram interwałów za pomocą pand? - pandy

Biorąc pod uwagę ramkę danych przedziałów („czas rozpoczęcia” i „czas zakończenia”), jaki byłby skuteczny sposób wygenerowania histogramu pokazującego dla każdego punktu czasowego T, ile przedziałów jest w nim „aktywnych”?

Kod do wygenerowania przykładowej ramki danych (przepraszam, jestem pewien, że jest lepszy sposób, aby to zrobić):

from random import randint

intervals = []

for i in range(50):
start = randint(0,50)
intervals.append({"start":start, "end":start+randint(0,50)})

intervals_df = pd.DataFrame(intervals)

Przykład:

Dla następującej ramki danych:

import pandas as pd
pd.DataFrame([{"start":2,"end":5},{"start":3,"end":8},{"start":9,"end":10},{"start":4,"end":5}])

Dopasowany wykres będzie podobny do:

Moją intuicją jest to, że przedziały czasowe należy jakoś przełamać, aby rozdzielić wartości, aby można je było grupować, ale jak?

Odpowiedzi:

3 dla odpowiedzi № 1

Możesz użyć apply aby wygenerować wartości dla każdego zakresu melt przekształcić dane w długą formę.

In [113]: expanded = df.apply(lambda row: pd.Series(np.arange(row["start"], row["end"] + 1)), axis=1)

In [114]: expanded
Out[114]:
0   1   2   3   4   5
0  2   3   4   5 NaN NaN
1  3   4   5   6   7   8
2  9  10 NaN NaN NaN NaN
3  4   5 NaN NaN NaN NaN

In [115]: expanded = pd.melt(expanded)["value"].dropna()

In [116]: expanded
Out[116]:
0      2
1      3
2      9
3      4
4      3
5      4
6     10
7      5
8      4
9      5
12     5
13     6
17     7
21     8
Name: value, dtype: float64

Stamtąd możesz użyć wbudowanego wykresu histogramu lub innego rodzaju binowania.

In [117]: expanded.hist()

1 dla odpowiedzi nr 2

odpowiedź chrisba jest świetna, ale powód, dla którego tymają odstęp między 5 a 6, ponieważ domyślna liczba pojemników wynosi domyślnie 10. Oznacza to, że w twoim przypadku pojemniki są odległe o 0,8, więc różnica wynosi w rzeczywistości między 5,2 a 6.

Sposobem na przeciwdziałanie temu jest ręczne ustawienie liczby pojemników równej długości twoich danych:

nb_bins = int(max(expanded) - min(expanded))
expanded.hist(bins = nb_bins)

Wynik: 1

Powiązane pytania

Skumulowany histogram nie działa w Pandach - python, pandy

Jak manipulować pandami DataFrame, aby narysować histogram ggplot - python, pandy, ggplot2

Wykreślanie jako linii przerywanej na histogramie z matplotlib - python, panda, matplotlib, spisek

Czy istnieje parametr matplotlib / pandy, który ma oś Y histogramu w procentach? - python, pandy, matplotlib

jak przekazać pandasową ramkę danych jako parametr do wykresu metody biblioteki matplotlib - python, pandy, matplotlib, ramka danych, wykresy

Dlaczego nie mogę użyć matplotlib.pyplot w Spyder? - python, pandy, anakonda

Jak wykreślić wiele serii z różnymi wartościami x w Pandach? - python, pandy, matplotlib

Superimpozycja histogramu i gęstości w Pandach / Matplotlib w Pythonie - python, pandy, matplotlib, histogram, seaborn

Histogram czasów z CSV za pośrednictwem Pand - python, parsowanie, pandy, histogram, timedelta

Wykres graficzny w Pandas lub Matplotlib - python, matplotlib, pandy

Narysuj więcej niż ramka danych na tej samej pandzie postaci - python, panda, fabuła

Jak wykreślić histogram z danymi przygotowanymi w Pandas DataFrame? - python, panda, ramka danych, wykres, histogram

Manipulacja seriami Pandas - zmiana x i y - python, pandy

wykreśla wybrane kolumny jako słupki i szeregi czasowe przy użyciu Pand - python, pandy

Panda druga oś y dla boksu - python, panda, boxplot

Wykres czasowy histogramów w Pythonie - python, matplotlib, panda, histogram

Wykreślanie wykresu słupkowego w ramce danych pandy - python, pandy, działka

Jak wykreślić wykres słupkowy z serii pand? - pandy, matplotlib, fabuła, ipython, seria

Szeregi serii czasowej w pandach i spiskach - pandy, spiskowane

Wykres słupkowy pandy z ciągłą osią x - pandy