Pertanyaan tentang topik tersebut 'amazon-emr'

memasukkan kumpulan data besar ke pengurangan peta elastis amazon
Ada beberapa kumpulan data besar (25 GB+, dapat diunduh di Internet) yang ingin saya uji menggunakan Amazon EMR. Daripada mengunduh kumpulan data ke komputer saya sendiri, lalu mengunggahnya kembali ke Amazon, apa cara terbaik untuk memasukkan...
882 dilihat
schedule 29.12.2023

Tidak dapat menyelesaikan ERROR 2017: Kesalahan internal membuat konfigurasi pekerjaan di EMR saat menjalankan PIG
Saya telah mencoba menjalankan tugas yang sangat sederhana dengan Pig di Amazon EMR. Ketika saya menjalankan perintah di shell interaktif, semuanya berfungsi dengan baik. Tetapi ketika saya menjalankan hal yang sama dengan pekerjaan batch, saya...
1981 dilihat
schedule 17.11.2023

Memfilter file parket yang sedang dibaca dengan PySpark
Saya memiliki kumpulan data besar file parket yang dipartisi yang disimpan di AWS s3 dan saya hanya ingin membaca sampel dari data setiap bulan menggunakan AWS EMR. Saya harus memfilter data setiap bulan berdasarkan nilai "user_id" dengan memilih,...
930 dilihat

Flink pada Node Tugas AWS EMR
Apakah mungkin untuk menjalankan pengelola tugas Flink pada simpul Tugas AWS EMR? Jika ya, apa bedanya dengan menjalankan Task Manager pada node inti?
99 dilihat