Правя питон-скрипт за почистване на CSV файл, който получаваме от Qualtrics за конкурс за предприемачество.
Досега аз нарязах данните и я написах в Excel файл с Pandas. Все пак имам няколко колони, с които ще трябва да създам нови редове. Например за всяко представяне на екипа имаме
Team Name Nb of teammates Team Leader One Team Leader Two
1 x 2 Joe Joey
2 y 1 Jack
...
Трябваше да се върна
Team Name Nb of teammates Team Leader
1 x 2 Joe
2 Joey
3 y 1 Jack
...
Това е много опростен пример за реалните данни, които имам, защото има повече колона, но се чудех как бих могъл да го направя в Pandas / Python.
Аз съм запознат с тези дискусии Вмъкване на ред и Индексиране: Настройка с разширение, но не знам какво да правя.
Благодаря за вашата помощ !
Отговори:
1 за отговор № 1можете да използвате стопилка:
#set up frame
df =pd.DataFrame({"Team Name":["x","y"], "Nb of teammates":[2,1], "Team Leader One":["Joe","Jack"],"Team Leader Two":["Joey",None]})
Разтопете рамката:
pd.melt(df,id_vars=["Team Name","Nb of teammates"],value_vars=["Team Leader One","Team Leader Two"]).dropna()
се завръща:
Team Name Nb of teamates variable value
0 x 2 Team Leader One Joe
1 y 1 Team Leader One Jack
2 x 2 Team Leader Two Joey