Saya telah mencoba menjalankan tugas yang sangat sederhana dengan Pig di Amazon EMR. Ketika saya menjalankan perintah di shell interaktif, semuanya berfungsi dengan baik. Tetapi ketika saya menjalankan hal yang sama dengan pekerjaan batch, saya mengerti
[utama] ERROR org.apache.pig.tools.grunt.Grunt - ERROR 2017: Kesalahan internal saat membuat konfigurasi pekerjaan.
dan menjalankan skrip gagal. Ini skrip 7 baris saya. Itu hanya menghitung rata-rata atas tupel bigram Google. mc adalah jumlah kecocokan dan vc adalah jumlah volume.
bigrams = LOAD 's3n://<<bucket-name>>/gbÂbigrams/*' AS (bigram:chararray, year:int, mc:int, vc:int);
grouped_bigrams = group bigrams by bigram;
answer1 = foreach grouped_bigrams generate group, ((DOUBLE) SUM(bigrams.mc))/COUNT(bigrams) AS avg_mc;
sort_answer1 = ORDER answer1 BY avg_mc desc;
answer2 = LIMIT sort_answer1 5;
STORE answer1 INTO 's3n://<bucket-name>/output/bigram/20130409/answer1';
STORE answer2 INTO 's3n://<bucket-name>/output/bigram/20130409/answer2';
Saya menduga kesalahan itu ada hubungannya dengan STORE dan jalur s3. Jadi saya telah mencoba berbagai kombinasi seperti menggunakan $OUTPUT, garis miring terbalik, dll. Namun tetap mendapatkan kesalahan yang sama. Bantuan apa pun akan sangat dihargai.