ฉันค่อนข้างใหม่กับ SPARKR ฉันดาวน์โหลด SPARK 1.4 และตั้งค่า RStudio เพื่อใช้ไลบรารี SPARKR อย่างไรก็ตาม ฉันต้องการทราบว่าฉันจะใช้ฟังก์ชันกับแต่ละค่าในคอลัมน์ของ DataFrame แบบกระจายได้อย่างไร ใครสามารถช่วยได้บ้าง ตัวอย่างเช่น,
มันทำงานได้อย่างสมบูรณ์แบบ
myFunc <- function(x) { paste(x , "_hello")}
c <- c("a", "b", "c")
d <- lapply(c, myFunc)
วิธีทำให้ใช้งานได้กับ Distributed DataFrame จุดประสงค์คือการผนวก "_hello" ต่อท้ายแต่ละค่าของชื่อคอลัมน์ของ DF
DF <- read.df(sqlContext, "TV_Flattened_2.csv", source = "com.databricks.spark.csv", header="true")
SparkR:::lapply(DF$Name, myFunc)
ในเวอร์ชันอัลฟ่าของ SPARKR ก่อนการเปิดตัว SPARK 1.4 ดูเหมือนว่าจะมีความสามารถนี้ ทำไมตอนนี้จึงขาดหายไปในการเปิดตัวอย่างเป็นทางการของ SPARK 1.4
name(DF)
แทนDF$Name
ไหม - person mts   schedule 12.08.2015