คำถามในหัวข้อ 'apache-spark-mllib'

Spark Scala Split DataFrame ตามช่วงค่าบางช่วง
สมมติว่าฉันมี dataframe ที่มีคอลัมน์ชื่อ x โดยมีช่วงค่าเป็น [0, 1] ฉันหวังว่าจะแบ่งตามค่าของคอลัมน์ x โดยมีช่วงเช่น [0, 0.1) , [0.1, 0.2) ... [0.9, 1] มีวิธีที่ดีและรวดเร็วในการทำเช่นนั้นหรือไม่? ฉันใช้ Spark 2 ใน Scala อัปเดต:...
1993 มุมมอง

ความสัมพันธ์ระหว่าง numFeatures ใน HashingTF ใน Spark MLlib และจำนวนคำศัพท์จริงในเอกสารคืออะไร
มีความสัมพันธ์ระหว่าง numFeatures ใน HashingTF ใน Spark MLlib และจำนวนคำศัพท์จริงในเอกสาร (ประโยค) หรือไม่? List<Row> data = Arrays.asList( RowFactory.create(0.0, "Hi I heard about Spark"), RowFactory.create(0.0, "I wish Java could use...
3290 มุมมอง