Pomoc w programowaniu, odpowiedzi na pytania / Pyton / Znajdowanie średnich przez klucz z csv w python - python, csv, średnia

Znalezienie średnich przez klucz z csv w python - python, csv, średnia

Mam prosty csv z dwiema kolumnami i muszę znaleźć średnią na klucz to znaczy wejście csv

A,2
B,3
A,1
C,2
B,2
D,4
C,2

wymagany wynik

{"A": 1.5, "B": 2.5, "C": 2, "D": 4}

Kod do tej pory:

pythoncsvfile = open("data.csv")
csv_reader = csv.reader(csvfile, delimiter=",")
for row in csv_reader:
print (row[0],row[1])

Odpowiedzi:

2 dla odpowiedzi № 1

Opcja A

Za pomocą csv

import csv
import collections

out = collections.defaultdict(list)
with open("file.csv") as f:
for line in csv.reader(f):
out[line[0]].append(int(line[1]))

for k in out:
out[k] = sum(out[k]) / len(out[k])

print(dict(out))

{"A": 1.5, "B": 2.5, "C": 2.0, "D": 4.0}

Opcja B

Za pomocą pandas

import pandas as pd

df = pd.read_csv("file.csv", header=None, names=["Key", "Value"])
out = df.groupby("Key").mean()

print(out.Value.to_dict())

{"A": 1.5, "B": 2.5, "C": 2.0, "D": 4.0}

1 dla odpowiedzi nr 2

Myślę, że możesz użyć następującego fragmentu kodu:

import csv
from collections import OrderedDict

data = OrderedDict()

with open("data.csv", "rb") as csvfile:
content = csv.reader(csvfile, delimiter=",")
for index, value in content:
if ( not data.has_key(index) ):
#initialize
data[index] = {"times":1, "total":float(value)}
else:
#index already present
data[index] = {"times": data[index]["times"]+1, "total":data[index]["total"]+float(value)}

def average(data):
results = OrderedDict()

for index, values in data.iteritems():
results[index] = values["total"]/values["times"]

return results

print average(data)

OrderedDict([("A", 1.5), ("B", 2.5), ("C", 2.0), ("D", 4.0)])

HTH

Powiązane pytania

TypeError: wskaźniki łańcuchowe muszą być liczbami całkowitymi, a nie znakami str, których część dotyczy? - python, lista, słownik

średnia ruchoma 3 elementów wg C lub Pythona - python, c, średnia, elementy, splot

Mierz średnią tygodniową wielu plików netCDF za pomocą NCO lub Python - python, numpy, matplotlib, netcdf, nco

Problemy ze znalezieniem średniej z listy i jej podlisty - python, liczby

Python numpy ważony średnio z nans - python, numpy

Średnia lista z listy - czy istnieje bardziej skuteczny sposób? - python, wydajność, python-3.x

Pobieranie wartości ze słownika Pythona - python, słownik

Znalezienie wiersza jest mądre i średnie dla wszystkich wierszy pliku rozdzielanego spacjami - python

Jak wyświetlić przecinek dziesiętny tylko wtedy, gdy nie jest to liczba całkowita? - python

średnia pythona listy - python, python-2.7

Jak porównać dwie zmienne. jedna to zmienna perla, a druga zmienna python - python, perl

Pairwise Elements Using Python - Obliczanie średniej poszczególnych elementów tablicy - python, json, for-loop, tablica wielowymiarowa

jak podsumować ten słownik Pythona i uzyskać średnią? - python-3.x

Jira - raport JQL pokazujący średnią liczbę rozwiązanych / utworzonych biletów w ciągu 30 dni - jira, jql

Obliczyć MACD i RSI w grails - java, matematyka, grails, groovy, akcje

oblicz czas, który upłynął między wierszami - czas upływający

Potrzebujesz wzoru na skumulowane średnie kroczące w Open Office - baza danych, openoffice.org, średnia, kalkulator, średnia ruchoma

Jak obliczyć średnie określonego zestawu interwałów na liście tablic? - c #, lista tablic, średnie, interwały

Uzyskaj średnią z całej zawartości listy <lista <int >> [zamknięta] - c #, lista, średnia

Przypisywanie wartości do tablicy w visual basic - tablice, vb.net, for-loop