Помощ при програмиране, отговори на въпроси / Питон / Как да "обединя" множество пандеми с индекс като колона за данни? - python, python-3.x, pandas, индексиране, информационна рамка

Как да "слеем" множество панда данни с индекс като колона за данни? - python, python-3.x, pandas, индексиране, информационна рамка

Имам два панда данни: един:

import pandas as pd
df1 = pd.read_csv("filename1.csv")
df1
A     B
0    1     22
1    2     15
2    5     99
3    6     1
....

и две

df2 = pd.read_csv("filename1.csv")
df2
A     B
0    1     6
1    3     52
2    4     15
3    5     62
...

Бих искал да обединя тези информационни рамки в единна рамка с колони A като индекс за този нов информационен кадър.

Колоните са имена на файлове, редовете са стойностите за "А".

Ако стойностите за този индекс не съществуват, NaN тогава съществува. Имената на графите трябва да са имената на файловете от * csv по-горе.

    filename1    filename2
1   22           6
2   15           NaN
3   NaN          52
4   NaN          15
5   99           62
6   1            NaN

Как се прави това? За два файла може да се използва pandas.merge(), но какво представляват десетките от оригиналните информационни рамки?

Отговори:

2 за отговор № 1

files = ["file1", "file2"]

def read(f):
f = f + ".csv"
df = pd.read_csv(f, usecols=["A", "B"])
return df.drop_duplicates(subset=["A"]).set_index("A").B

pd.concat([read(f) for f in files], axis=1, keys=files)

Свързани въпроси

Присъединяването към два неравномерни кадъра на данните - питън, панда

името на колоната се промени автоматично - python, pandas, dataframe

Pandas как да конкатират два информационни рамки, без да губят заглавията на колоните - питън, панда

Използване на pandas.DataFrame.at () в for loop - python, list, pandas, for-loop, dataframe

Вложените се сливат в панди със суфикси - питън, панда

Вмъкване на стойности от множество панда данни с несортиран индекс към съществуваща колона в друг dataframe - python, pandas

Обединяване на информационните рамки и попълване на колоната за всеки 12 часа, базиран на пандата за индекса на датата? - питън, панда, информационна рамка

Pandas DataFrame съдържа странно поведение - python, pandas, dataframe

Python Pandas - Получаване на местоположение от 2nd dataframe използвайки първи данни - python, pandas

Управление на множество информационни рамки - python, python-3.x, pandas, dataframe

Python Pandas concate dataframe - NaN вместо стойности - python, pandas, merge

Присъединяването към 3 панда информационни кадри - питън, панда, присъединете се

Комбинирайте множество информационни рамки в една, която сумира техните стойности според индекса - python, pandas, sum

Присъединяване към 2 информационни рамки в конкретна колона с идентификатори - python, pandas

Индексиране на пандемите за данни в пандемите на данни с python - python, python-2.7, indexing, pandas

pandas dataframes се сливат със същите имена на колони, дават приоритет на един - питън, join, pandas, merge, dataframe

Сливане на два информационни рамки в Python pandas - python, pandas, dataframe, merging

Комбиниране на огромен списък от информационни рамки в един информационен кадър без да се получи грешка в паметта? - python-3.x

Python - Pandas Dataframe с няколко имена на колона - python-3.x, pandas, dataframe

Не може да се импортира pandas Dataframe - python-3.x, pandas