Я хочу написать функцию загрузки UDF Python для Apache Pig, чтобы я мог использовать ее в сценарии Pig следующим образом:
register 'myudfs.py' using jython as myfuncs;
A = load 'data' using myfuncs.myLoader() as line;
документация по Pig содержит некоторые сведения о написании пользовательских функций загрузки на Java, но не в Python. Мне удалось реализовать довольно полезные функции Eval с помощью Python, но я не смог найти ничего о том, как писать функции загрузки на этом языке.
Поскольку я уже реализовал несколько Eval UDF на Python, я хотел бы придерживаться этого языка для всех своих UDF.