Eu preciso obter a média para toda a coluna, acessando a coluna pelo seu índice
pd.mean (axis = 1) me dá uma média para cada linha da coluna. Mas eu preciso da média para a soma de todos os valores na coluna semelhante a descrever a função para o dataframe do pandas.
Data michael burleigh
07/02/2016 0
14/02/2016 0
21/02/2016 0
28/02/2016 0
06/03/2016 0
13/03/2016 0
3/20/2016 0
3/27/2016 0
03/04/2016 98
10/04/2016 99
17/04/2016 99
24/04/2016 100
01/05/2016 100
08/05/2016 0
Respostas:
0 para resposta № 1Você pode usar aplicar.
import numpy as np
import pandas
data = [{"a": 1, "b": 2, "c": 3}, {"a": 1, "b": 5, "c": 6}, {"a": 1, "b": 3, "c": 4}]
df = pandas.DataFrame.frompandas.date_range("2016-01-01", "2016-01-03", freq="D")
df.apply(np.mean)
# Answer
# a 1.000000
# b 3.333333
# c 4.333333
# dtype: float64
Além disso, se você sabe o nome da coluna, você poderia apenas fazer.
In [13]: df ["b"].mean()
Out[13]: 3.3333333333333335