Вопросы по теме 'apache-spark-mllib'
Spark Scala Разделить DataFrame по некоторому диапазону значений
Предположим, у меня есть фрейм данных со столбцом с именем x с диапазоном значений [0, 1] . Я надеюсь разделить его по значению столбца x с такими диапазонами, как [0, 0.1) , [0.1, 0.2) ... [0.9, 1] . Есть ли хороший и быстрый способ сделать...
1993 просмотров
schedule
20.01.2024
Какова связь между numFeatures в HashingTF в Spark MLlib и фактическим количеством терминов в документе?
Есть ли какая-либо связь между numFeatures в HashingTF в Spark MLlib и фактическим количеством терминов в документе (предложении)?
List<Row> data = Arrays.asList(
RowFactory.create(0.0, "Hi I heard about Spark"),
RowFactory.create(0.0,...
3290 просмотров
schedule
21.11.2023