เป็นไปได้ไหมที่จะหาค่ามัธยฐานของประกายไฟแบบกระจาย? ขณะนี้ฉันกำลังค้นหา: Sum
, Average
, Variance
, Count
โดยใช้รหัสต่อไปนี้:
dataSumsRdd = numRDD.filter(lambda x: filterNum(x[1])).map(lambda line: (line[0], float(line[1])))\
.aggregateByKey((0.0, 0.0, 0.0),
lambda (sum, sum2, count), value: (sum + value, sum2 + value**2, count+1.0),
lambda (suma, sum2a, counta), (sumb, sum2b, countb): (suma + sumb, sum2a + sum2b, counta + countb))
#Generate RDD of Count, Sum, Average, Variance
dataStatsRdd = dataSumsRdd.mapValues(lambda (sum, sum2, count) : (count, sum, sum/count, round(sum2/count - (sum/count)**2, 7)))
ฉันไม่ค่อยแน่ใจว่าจะหาค่ามัธยฐานได้อย่างไร ในการหาค่าเบี่ยงเบนมาตรฐาน ผมก็แค่หาผลลัพธ์เฉพาะที่ด้วยความแปรปรวนของการรูทกำลังสอง เมื่อฉันรวบรวมค่ามัธยฐานแล้วฉันก็สามารถทำ Skewness ในพื้นที่ได้อย่างง่ายดายเช่นกัน
ฉันมีข้อมูลเป็นคู่คีย์/ค่า (คีย์ = คอลัมน์)