У меня есть 2 таблицы-
bpm_agent_data - 40 Million records , 5 Columns
bpm_loan_data - 20 Million records, 5 Columns
Теперь я выполнил запрос в Hive-
select count(bpm_agent_data.AgentID), count(bpm_loan_data.LoanNumber) from bpm_agent_data JOIN bpm_loan_data where bpm_loan_data.id = bpm_agent_data.id;
который занимает много времени для завершения. Каким должен быть идеальный способ написать запрос в HIVE, чтобы Reducer не занимал так много времени.