Elasticsearch Spark จะสืบค้นหลายครั้งได้อย่างไร

ฉันอยู่ในสมุดบันทึกของ jupyter

ฉันต้องการใช้ dsl แบบสอบถามเพื่อเตรียม Dataframe เริ่มต้น

ฉันใช้ conf.set("es.query", dsl_query) เพื่อสิ่งนั้น (https://www.elastic.co/guide/en/elasticsearch/hadoop/current/configuration.html#_querying)

แต่ฉันต้องการใช้แบบสอบถามอื่นเพื่อเตรียม Dataframe อื่น และฉันไม่สามารถหาวิธีใช้ dsl_query ใหม่โดยไม่ต้องสร้าง SparkContext ใหม่

แต่ฉันไม่พบวิธีสร้าง SparkContext ภายในสภาพแวดล้อม jupyter ขึ้นมาใหม่เช่นกัน

ฉันต้องการเรียกใช้การวิเคราะห์โดยใช้ QueryDSL-1 เป็นข้อมูลพื้นฐาน จากนั้นจึงเรียกใช้การวิเคราะห์อื่นโดยใช้ QueryDSL-2 เป็นข้อมูลพื้นฐานอื่น

มีวิธีการทำเช่นนี้โดยไม่ต้องสร้างสมุดบันทึกสองเล่มหรือไม่?


person eugene    schedule 13.02.2019    source แหล่งที่มา
comment
คุณไม่จำเป็นต้องกำหนดแบบสอบถามในการกำหนดค่า spark ของคุณ   -  person eliasah    schedule 13.02.2019
comment
คุณสามารถระบุ es.query เป็นตัวเลือกให้กับ DataFrameReader ของคุณ เช่น spark.read.option("es.query", dsl_query).option("...", "...") ...   -  person eliasah    schedule 13.02.2019
comment
ใช่มันได้ผล คุณช่วยตอบได้ไหม ฉันจึงยอมรับได้   -  person eugene    schedule 25.11.2019


คำตอบ (1)


คุณเพียงแค่ต้องระบุ es.query เป็นตัวเลือกสำหรับ DataFrameReader ของคุณ เช่น :

spark.read.option("es.query", dsl_query).option("...", "...")
person eliasah    schedule 25.11.2019