อ่านไฟล์ asciif แบบไม่คั่นด้วย Apache Pig Latin

ฉันกำลังพยายามอ่านไฟล์ข้อความใน Apache Pig Latin ที่มี ASCII แบบไม่คั่นซึ่งประกอบด้วยแต่ละแถว กล่าวคือ แต่ละคอลัมน์ในแถวนั้นเริ่มต้นและสิ้นสุดที่ตำแหน่งเฉพาะในแถว

คำจำกัดความตัวอย่าง:

+--------+----------------+--------------+
| Column | Start Position | End Position |
+--------+----------------+--------------+
| A      | 1              | 6            |
+--------+----------------+--------------+
| B      | 8              | 11           |
+--------+----------------+--------------+
| C      | 13             | 15           |
+--------+----------------+--------------+

ข้อมูลตัวอย่าง:

+---+---+---+---+---+---+---+----+---+----+----+----+----+----+----+
| 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8  | 9 | 10 | 11 | 12 | 13 | 14 | 15 |
+---+---+---+---+---+---+---+----+---+----+----+----+----+----+----+
| s | a | m | p | l | e |   | d  | a | t  | a  |    |    | h  | i  |
+---+---+---+---+---+---+---+----+---+----+----+----+----+----+----+
| d | u | d | e |   |   |   | hi |   |    |    |    | b  | r  | o  |
+---+---+---+---+---+---+---+----+---+----+----+----+----+----+----+

ผลลัพธ์ที่คาดหวัง:

sample, data, hi
dude, hi, bro

ฉันจะอ่านสิ่งนี้ใน Pig ได้อย่างไร PigStorage ดูเหมือนจะไม่ยืดหยุ่นพอที่จะอนุญาตให้ใช้การกำหนดตำแหน่งได้ แต่จะกำหนดเฉพาะสตริงเท่านั้น (ลูกน้ำ แท็บ ฯลฯ)

ph34r 08.07.2016 แหล่งที่มา

คำตอบ (1)

arrow_upward
0
arrow_downward

ดูเหมือนว่า Apache จะมีตัวโหลดสำหรับกรณีการใช้งานเฉพาะนี้:

LOAD 'data.txt' USING org.apache.pig.piggybank.storage.FixedWidthLoader('1-6, 8-11, 13-15', 'SKIP_HEADER') AS (a, b, c);

https://pig.apache.org/docs/r0.16.0/api/

ph34r 08.07.2016

คำถามในหัวข้อ

จัดเรียงสตริงในคอลัมน์และพิมพ์กราฟ
แปลงบิตสั้นให้เป็น int
อัปโหลดภาพด้วย idhttp indy9 delphi7
วิธีรับการเชื่อมโยง activerecord ผ่านการไตร่ตรอง
เปรียบเทียบรูปภาพ BLOB กับรูปภาพที่จัดเก็บเป็น ORDImage โดยใช้ภาพนิ่ง SQL/MM
สำหรับ Apache Pig ฉันจะเขียน Load UDF ใน python ได้อย่างไร
R {xml_node} เป็นข้อความธรรมดาในขณะที่รักษาแท็กไว้หรือไม่
TypeScript ใน Visual Studio Online Build
วิธีแปลง html เป็น sencha touch
ดัชนีลูซีน: เอกสารหายไป
การติดตั้ง Jboss ON กำลังรอเซิร์ฟเวอร์
วิธีการทั่วไปที่รับพารามิเตอร์เฉพาะและส่งกลับพารามิเตอร์เฉพาะ Java
จะรับประเภทที่กำหนดไว้ทั้งหมดได้อย่างไร?
จะระบุตัวชี้เป็นที่เก็บข้อมูล thread_local ใน C ++ ได้อย่างไร
การใช้ VB.NET เพื่อส่งการแจ้งเตือนไปยัง android emulator ได้รับข้อผิดพลาด 401
Laravel - แบ่งหน้าบันทึกแบบสุ่ม
Lua เปรียบเทียบค่าหลายตาราง
การสร้าง JSON ของโครงสร้างไดเร็กทอรีเพื่อการใช้งานโดยวิดเจ็ตทรี Webix
ไม่สามารถคลิกเมนูย่อยโดยใช้ไดรเวอร์เว็บซีลีเนียม
SL 4: พฤติกรรมแปลก ๆ พร้อมการควบคุมแบบเทมเพลต