Я новичок в работе на основе rdd. Я пытаюсь понять максимальное значение ключа. У меня есть такой rdd:
RDD = sc.parallelize([("A", 2, 1), ("C", 8, 5), ("B", 3, 4), ("A", 7, 5), ("C", 5, 8), ("C", 6, 10), ("B", 10, 6)])
Мне нужно найти максимум 2-х элементов на основе ключей. Я хотел бы видеть такой вывод;
("A", 7, 5)
("B", 10, 6)
("C", 6, 10)
Я пробовал newrdd = RDD.reduceByKey(lambda x: max(x[2]))
. Выдает какие-то ошибки.