มีวิธีสร้างเวกเตอร์กระจัดกระจายจากเวกเตอร์หนาแน่นใน PySpark หรือไม่? วิธีที่ฉันทำมีดังต่อไปนี้:
Vectors.sparse(len(denseVector), [(i,j) for i,j in enumerate(denseVector) if j != 0 ])
ซึ่งเป็นไปตามรูปแบบ [ขนาด (ดัชนี ข้อมูล)] ดูเหมือนแฮ็คเลย มีวิธีที่มีประสิทธิภาพกว่านี้ไหม?