สตรีมข้อมูลเป็นวัตถุ json ใน pig

ฉันมีสคริปต์ที่ใช้วัตถุ json ที่ซับซ้อน (หนึ่งรายการต่อบรรทัด) ในอินพุตและเอาต์พุตในรูปแบบ hadoc ฉันต้องการใช้ pig เพื่อสตรีมข้อมูลบางอย่างผ่านสคริปต์นี้โดยใช้ STREAM ฉันจะบังคับให้ Pig ส่งข้อมูลไปยังสตรีมมิ่งในรูปแบบ json ได้อย่างไร ฉันกำลังมองหาบางอย่างเช่น

C = stream A through `stream.py` USING JsonStorage()

person Georges Dupret    schedule 08.11.2013    source แหล่งที่มา


คำตอบ (1)


ดูเหมือนว่าจะยังไม่มีการดำเนินการดังกล่าวในสุกร ทางเลือกที่ดีที่สุดอาจเป็นการใช้ ToJson UDF ซึ่งส่งออกสตริง json จากนั้นใน ฟังก์ชันสตรีมมิ่งจะโหลดสตริงเป็นอ็อบเจ็กต์ json โดยใช้ json.loads(inputstring) ของ python

person John Jiang    schedule 30.08.2014