Я использую pandas для выполнения некоторых аналитических упражнений. Я хочу создать новый столбец, значение которого представляет собой сумму двух строк. Исходный набор данных выглядит следующим образом...
Admit Gender Dept Freq
0 Admitted Male A 512
1 Rejected Male A 313
2 Admitted Female A 89
3 Rejected Female A 19
4 Admitted Male B 353
5 Rejected Male B 207
6 Admitted Female B 17
7 Rejected Female B 8
8 Admitted Male C 120
9 Rejected Male C 205
10 Admitted Female C 202
11 Rejected Female C 391
12 Admitted Male D 138
13 Rejected Male D 279
14 Admitted Female D 131
15 Rejected Female D 244
16 Admitted Male E 53
17 Rejected Male E 138
18 Admitted Female E 94
19 Rejected Female E 299
20 Admitted Male F 22
21 Rejected Male F 351
22 Admitted Female F 24
23 Rejected Female F 317
Я хочу создать новый столбец, используя следующий фрейм данных...
Dept Gender Freq
0 A Female 108
1 A Male 825
2 B Female 25
3 B Male 560
4 C Female 593
5 C Male 325
6 D Female 375
7 D Male 417
8 E Female 393
9 E Male 191
10 F Female 341
11 F Male 373
Я хочу создать новый столбец в первом фрейме данных, используя столбец Freq
второго фрейма данных. Мне нужно вставить значение 108
if Detp and Gender
одинаковое в обоих фреймах данных. Новый фрейм данных должен выглядеть так...
Admit Gender Dept Freq Total
0 Admitted Male A 512 825
1 Rejected Male A 313 825
2 Admitted Female A 89 108
3 Rejected Female A 19 108
4 Admitted Male B 353 560
5 Rejected Male B 207 560
6 Admitted Female B 17 25
7 Rejected Female B 8 25
Я пробовал следующий код...
for i in data.iterrows():
for j in total_freq.iterrows():
if i[1].Gender == total_freq.Gender & i[1].Dept == total_freq.Dept:
data['Total'] = total_freq.Freq
Я получаю следующую ошибку... TypeError: cannot compare a dtyped [object] array with a scalar of type [bool]
Любая помощь для создания столбца с правильными значениями?