Есть ли способ сопоставить два разных фрейма данных для нескольких столбцов

Я хочу сделать ссылку между столбцами по условию. У меня есть два кадра данных следующим образом:

df1<-read.table(text=" gol
4
7
6
9
",header=TRUE)

а второй df:

df2<-read.table(text=" cost1	cost2	cost3	cost4
7	9	5	13
3	12	4	14
9	13	3	11
5	6	2	13
4	3	5	12
8	16	6	9
9	11	2	9
6	14	11	12
5	10	14	6
2	9	4	12

",header=TRUE)

Условие, например, в df2, cost1, если значение больше или равно 4 в df1, оно получает "y", иначе оно получает "n". в Cost 2, если значение больше или равно 7 в df1, он получает «y», иначе он получает «n» и так далее. Предположим, у меня более четырех столбцов.

Результат будет следующим:

output<-read.table(text=" cost1	cost2	cost3	cost4	out1	out2	out3	out4
7	9	5	13	y	y	n	y
                   3	12	4	14	n	y	n	y
                   9	13	3	11	y	y	n	y
                   5	6	2	13	y	n	n	y
                   4	3	5	12	y	n	n	y
                   8	16	6	9	y	y	y	y
                   9	11	2	9	y	y	n	y
                   6	14	11	12	y	y	y	y
                   5	10	14	6	y	y	y	n
                   2	9	4	12	n	y	n	y
                   ",header=TRUE)

Мне только сейчас нужно сделать это с помощью ifelse, но я изо всех сил пытался сделать это для этого примера. Ваша помощь очень ценна.


person Community    schedule 30.11.2019    source источник


Ответы (2)


Вероятно, есть лучшее и более элегантное решение, о котором я еще не думал, но, используя цикл for с функцией ifelse, вы можете сделать что-то вроде этого:

dfx <- data.frame(matrix(ncol=ncol(df2),nrow = nrow(df2)))
for(i in 1:ncol(df2))
{
  dfx[,i] <- ifelse(df2[,i] >= df1[i,1],"y","n")
  colnames(dfx)[i] <- paste0("out",i)
}
out <- cbind(df2,dfx)

И вы получите следующий вывод:

> out
   cost1 cost2 cost3 cost4 out1 out2 out3 out4
1      7     9     5    13    y    y    n    y
2      3    12     4    14    n    y    n    y
3      9    13     3    11    y    y    n    y
4      5     6     2    13    y    n    n    y
5      4     3     5    12    y    n    n    y
6      8    16     6     9    y    y    y    y
7      9    11     2     9    y    y    n    y
8      6    14    11    12    y    y    y    y
9      5    10    14     6    y    y    y    n
10     2     9     4    12    n    y    n    y
person dc37    schedule 30.11.2019

Вот решение без использования for-loop:

r <- setNames(data.frame(as.matrix(df2)>=outer(rep(1,nrow(df2)),df1$gol)),
              paste0("out",seq(ncol(df2))))
r[r==T] <- "y"
r[r==F] <- "n"
res <- cbind(df2,r)

который дает:

> res
   cost1 cost2 cost3 cost4 out1 out2 out3 out4
1      7     9     5    13    y    y    n    y
2      3    12     4    14    n    y    n    y
3      9    13     3    11    y    y    n    y
4      5     6     2    13    y    n    n    y
5      4     3     5    12    y    n    n    y
6      8    16     6     9    y    y    y    y
7      9    11     2     9    y    y    n    y
8      6    14    11    12    y    y    y    y
9      5    10    14     6    y    y    y    n
10     2     9     4    12    n    y    n    y
person ThomasIsCoding    schedule 30.11.2019