Я работаю над UDF для обработки файлов XML в кластере Hadoop. Я использую PIG для загрузки файлов XML, а затем использую свой UDF для выравнивания структуры данных XML.
Моя текущая реализация использует синтаксический анализатор DOM, и мне не нужно было включать банки синтаксического анализатора DOM вместе с моей банкой udf. Я планирую перенести эту реализацию с парсера DOM на парсер SAX.
Предоставляет ли фреймворк hadoop/pig эти jar-файлы для синтаксических анализаторов SAX «из коробки», или мне нужно, чтобы они были включены вместе с моим udf jar-файлом?