Учитывая несколько наборов данных, которые могут/не могут перекрываться в одном или нескольких столбцах, я хочу динамически объединить наборы данных вместе.
Есть ли библиотека или фрагмент кода, который будет объединять наборы данных таким образом? Как насчет того, чтобы просто использовать один столбец в качестве ключа?
ПРИМЕР. Объединение двух наборов данных с использованием нескольких столбцов в качестве ключей (BookTitle, Author)
Ввод, набор данных 1
BookTitle, Author, Publisher
title1, author1, publisher1
title2, author2, publisher2
title3, author3, publisher3
Ввод, набор данных 2
BookTitle, Author, NumPages
title4, author4, numPages4
title7, author7, numPages7
title5, author5, numPages5
title3, author33, numPages3
title2, author2, numPages2
Вывод, измененный набор данных
BookTitle, Author, Publisher, NumPages
title1, author1, publisher1, _null_
title2, author2, publisher2, numPages2
title3, author3, publisher3, _null_
title4, author4, _null_, numPages4
title5, author5, _null_, numPages5
title7, author7, _null_, numPages7
title3, author33, _null_, numPages3
Я провел некоторое исследование, и сразу ничего полезного не обнаружилось (в основном об однократном слиянии объектов JSON в одной и той же структуре (т. е. добавление данных, а не слияние отдельных наборов данных)).
Я ищу Java/JavaScript, используя данные JSON/XML/CSV (в порядке предпочтения), но приму другие языки, предполагая, что эти алгоритмы могут быть перенесены.
Я также рассмотрю возможность принятия примеров, когда это делается только для одного столбца.