รองรับ SAX Parser ใน Apache Pig

ฉันกำลังทำงานกับ UDF เพื่อประมวลผลไฟล์ XML บนคลัสเตอร์ Hadoop ฉันใช้ PIG เพื่อโหลดไฟล์ XML จากนั้นฉันใช้ UDF เพื่อทำให้โครงสร้างของข้อมูล XML เรียบลง

การใช้งานปัจจุบันของฉันคือการใช้ตัวแยกวิเคราะห์ DOM และฉันไม่จำเป็นต้องรวมขวดตัวแยกวิเคราะห์ DOM เข้ากับ udf jar ของฉัน ฉันกำลังวางแผนที่จะเปลี่ยนการใช้งานนี้จากตัวแยกวิเคราะห์ DOM ไปเป็นตัวแยกวิเคราะห์ SAX

เฟรมเวิร์ก Hadoop/pig จัดเตรียม jars เหล่านั้นสำหรับ SAX parsers ทันทีหรือฉันต้องรวมไว้กับ udf jar ของฉันหรือไม่


person divinedragon    schedule 23.05.2013    source แหล่งที่มา


คำตอบ (1)


ความผิดฉันเอง. ฉันเริ่มทำงานกับ SAX Parser และพวกเขาก็มาคู่กันด้วย

person divinedragon    schedule 23.05.2013