Apakah ada cara bawaan untuk membuat vektor renggang dari vektor padat di PySpark? Cara saya melakukan ini adalah sebagai berikut:
Vectors.sparse(len(denseVector), [(i,j) for i,j in enumerate(denseVector) if j != 0 ])
Itu memenuhi format [ukuran, (indeks, data)]. Sepertinya agak hacky. Apakah ada cara yang lebih efisien untuk melakukannya?