ฉันกำลังทำงานกับ UDF เพื่อประมวลผลไฟล์ XML บนคลัสเตอร์ Hadoop ฉันใช้ PIG เพื่อโหลดไฟล์ XML จากนั้นฉันใช้ UDF เพื่อทำให้โครงสร้างของข้อมูล XML เรียบลง
การใช้งานปัจจุบันของฉันคือการใช้ตัวแยกวิเคราะห์ DOM และฉันไม่จำเป็นต้องรวมขวดตัวแยกวิเคราะห์ DOM เข้ากับ udf jar ของฉัน ฉันกำลังวางแผนที่จะเปลี่ยนการใช้งานนี้จากตัวแยกวิเคราะห์ DOM ไปเป็นตัวแยกวิเคราะห์ SAX
เฟรมเวิร์ก Hadoop/pig จัดเตรียม jars เหล่านั้นสำหรับ SAX parsers ทันทีหรือฉันต้องรวมไว้กับ udf jar ของฉันหรือไม่