Вопросы по теме 'apache-spark-mllib'

Spark Scala Разделить DataFrame по некоторому диапазону значений
Предположим, у меня есть фрейм данных со столбцом с именем x с диапазоном значений [0, 1] . Я надеюсь разделить его по значению столбца x с такими диапазонами, как [0, 0.1) , [0.1, 0.2) ... [0.9, 1] . Есть ли хороший и быстрый способ сделать...
1993 просмотров

Какова связь между numFeatures в HashingTF в Spark MLlib и фактическим количеством терминов в документе?
Есть ли какая-либо связь между numFeatures в HashingTF в Spark MLlib и фактическим количеством терминов в документе (предложении)? List<Row> data = Arrays.asList( RowFactory.create(0.0, "Hi I heard about Spark"), RowFactory.create(0.0,...
3290 просмотров