Опитвам се да обединя две рамки за данни тук е моят код:
как зареждам данните:
import pandas as pd
df_population = pd.read_csv("C:/Users/Satgiaire
05/Downloads/population_commune.csv",encoding = "iso-8859-1")
Как обединявам данни
df_merged2 = pd.merge(df_population, df_merged, left_on=["CODGEO"],
right_on=["Code_commune_INSEE"],how="inner")
успее, но името на колоната CODGEO се е променило и знам, че имам CODGEO_X. Имам CODGEO в двете данни рамка и аз искам да имам само CODGEO БЕЗ X
Отговори:
1 за отговор № 1Промените в имената, които виждате, се определят от suffixes=
влязъл pandas.DataFrame.merge
, Тази опция се използва само ако има колони със същото име, които не се използват за сливането. Например:
df1 = pd.DataFrame({"a": [1,2,3], "b": [4,5,6]})
df2 = pd.DataFrame({"a": [1,2,3], "c": [4,5,6]})
pd.merge(df1, df2, left_on=["b"], right_on=["c"])
a_x b a_y c
0 1 4 1 4
1 2 5 2 5
2 3 6 3 6
като има предвид:
df1 = pd.DataFrame({"a": [1,2,3], "b": [4,5,6]})
df2 = pd.DataFrame({"a": [1,2,3], "c": [4,5,6]})
pd.merge(df1.drop("a", axis=1), df2, left_on=["b"], right_on=["c"])
b a c
0 4 1 4
1 5 2 5
2 6 3 6
Така че ще трябва да идентифицирате колони, за които знаете, че са дубликати, които не използвате като част от сливането си, и ги пуснете от един от вашите DataFrames.