Baca file asciif yang tidak dibatasi Apache Pig Latin

Saya mencoba membaca file teks dalam Apache Pig Latin yang memiliki ascii tidak terbatas yang terdiri dari setiap baris. Artinya, setiap kolom dalam baris tersebut dimulai dan diakhiri pada posisi tertentu dalam baris tersebut.

Definisi sampel:

+--------+----------------+--------------+
| Column | Start Position | End Position |
+--------+----------------+--------------+
| A      | 1              | 6            |
+--------+----------------+--------------+
| B      | 8              | 11           |
+--------+----------------+--------------+
| C      | 13             | 15           |
+--------+----------------+--------------+

Contoh data:

+---+---+---+---+---+---+---+----+---+----+----+----+----+----+----+
| 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8  | 9 | 10 | 11 | 12 | 13 | 14 | 15 |
+---+---+---+---+---+---+---+----+---+----+----+----+----+----+----+
| s | a | m | p | l | e |   | d  | a | t  | a  |    |    | h  | i  |
+---+---+---+---+---+---+---+----+---+----+----+----+----+----+----+
| d | u | d | e |   |   |   | hi |   |    |    |    | b  | r  | o  |
+---+---+---+---+---+---+---+----+---+----+----+----+----+----+----+

Hasil yang Diharapkan:

sample, data, hi
dude, hi, bro

Bagaimana cara membaca ini di Pig? PigStorage tampaknya tidak cukup fleksibel untuk memungkinkan pembatasan posisi, hanya pembatasan string (koma, tab, dll.).

ph34r 08.07.2016 sumber

Jawaban (1)

arrow_upward
0
arrow_downward

Sepertinya Apache menyediakan pemuat untuk kasus penggunaan khusus ini:

LOAD 'data.txt' USING org.apache.pig.piggybank.storage.FixedWidthLoader('1-6, 8-11, 13-15', 'SKIP_HEADER') AS (a, b, c);

https://pig.apache.org/docs/r0.16.0/api/

ph34r 08.07.2016

Pertanyaan tentang topik tersebut

Urutkan string dalam kolom dan cetak grafik
Ubah bit pendek menjadi int
Unggah Gambar Dengan idhttp indy9 delphi7
Cara mendapatkan asosiasi rekaman aktif melalui refleksi
Bandingkan gambar BLOB dengan gambar yang disimpan sebagai ORDImage menggunakan Gambar Diam SQL/MM
Untuk Apache Pig, bagaimana cara menulis Load UDF dengan python
R {xml_node} ke teks biasa sambil mempertahankan tag?
TypeScript di Visual Studio Online Build
cara mengubah html ke sencha touch
Indeks Lucene: Dokumen hilang
Instalasi Jboss ON menunggu server
Metode Generik Yang mengambil parameter unik dan mengembalikan parameter unik Java
Bagaimana cara mendapatkan semua tipe yang ditentukan?
Bagaimana cara menentukan pointer sebagai penyimpanan thread_local di C++?
Menggunakan VB.NET untuk mengirim notifikasi ke emulator Android mendapatkan error 401
Laravel - Membuat paginasi catatan acak
Lua Bandingkan Beberapa Nilai Tabel
Menghasilkan struktur direktori JSON untuk digunakan oleh widget pohon Webix
Tidak dapat mengklik SubMenu menggunakan driver web Selenium
SL 4: Perilaku aneh dengan kontrol templat