Pertanyaan tentang topik tersebut 'hive'

Hal dasar tentang Hadoop dan Hive
Saya sudah mulai bekerja dengan Hadoop baru-baru ini. Ada tabel bernama Checkout yang saya akses melalui Hive. Dan di bawah ini adalah jalur masuknya data ke HDFS dan info lainnya. Lalu informasi apa yang bisa saya peroleh jika saya harus membaca...
766 dilihat
schedule 19.11.2023

Group By di Hive pada tabel yang dipartisi memberikan baris hasil duplikat
Menggunakan rilis 0.11.0. Saya mendapatkan hasil yang salah ketika mencoba menjalankan kueri ini select t1.symbol, max(t1.maxts - t1.orderts) as diff from (select catid, symbol, max(cast(timestamp as double)*1000) as maxts,...
2401 dilihat
schedule 19.12.2023

Tidak dapat membuat tabel eksternal di sarang untuk menunjukkan tabel hbase
Saya seorang siswa yang mencoba memahami cara kerja semua hal hadoop. Jadi, saya menjalankan cloudera di 15 mesin. Konfigurasinya baik-baik saja, semua layanan berwarna hijau. Saya mengimpor baris mysql 12k di bawah hbase dan semuanya berjalan...
1450 dilihat
schedule 12.01.2024

Memproses XML kompleks di Hadoop untuk mengekstrak data
Saya ingin memproses XML yang diformat di Hadoop, yang cukup rumit dan besar serta mengandung loop. Saya mencoba opsi berikut: Memuat XML ke Hive sebagai satu kolom dan menggunakan kueri XPATH. Buat tabel Hive menggunakan SerDe. Muat XML...
795 dilihat
schedule 01.01.2024

Hive - Memeriksa apakah array di setiap baris tabel berisi data yang cocok di kolom di tabel lain
Saya memiliki dua tabel dengan kolom seperti yang ditunjukkan di bawah ini. Posts: user STRING, tag_list ARRAY<STRING> Tags: tag STRING Berikut beberapa contoh data pada tabel tersebut. Posts: user1 help, pig user2 bigdata,...
6309 dilihat
schedule 15.11.2023

Kueri Hive yang dioptimalkan dengan JOIN , memiliki jutaan catatan
Saya punya 2 meja- bpm_agent_data - 40 Million records , 5 Columns bpm_loan_data - 20 Million records, 5 Columns Sekarang saya menjalankan kueri di Hive- select count(bpm_agent_data.AgentID), count(bpm_loan_data.LoanNumber) from...
277 dilihat
schedule 17.01.2024

Pemilihan kolom di sarang
Saya memiliki tabel Pelanggan dengan 200 kolom. Saya ingin membuat tabel lain dari tabel Pelanggan yang seharusnya hanya memiliki 190 kolom. Bagaimana saya bisa melewati beberapa kolom di sarang dari tabel dasar?
62 dilihat
schedule 30.11.2023

sarang cap tanggal & waktu dari unix_timestamp()
Saya perlu dua kolom untuk disisipkan dengan tanggal sekarang (sysdate) dan cap waktu. Saya telah membuat tabel dan memasukkan data menggunakan unix_timestamp. Saya tidak dapat mengonversi ke dalam format stempel tanggal dan waktu. ############...
5067 dilihat
schedule 13.11.2023

Hive dan Hadoop Hanya Berjalan Secara Lokal
Saya telah mengkonfigurasi cluster Hadoop 3 node. Saya mencoba menggunakan Hive di atasnya. Hive sepertinya selalu berjalan hanya dalam mode lokal. Saya mendengar bahwa Hive mengambil nilai dari Hadoop tentang cluster. Jadi saya menjalankan...
1314 dilihat
schedule 03.01.2024

Apakah avroserde di sarang mengizinkan untuk memperbarui atau menghapus catatan?
Saya memiliki tabel di sarang yang dibuat menggunakan ROW FORMAT SERDE 'org.apache.hadoop.hive.serde2.avro.AvroSerDe' . Mencoba memperbarui catatan tetapi saya menerima pesan kesalahan berikut: FAILED: SemanticException [Error 10294]: Attempt...
553 dilihat
schedule 28.10.2023

Cara Sqoop tabel sistem CDC dari sql server
Saya dapat menarik tabel dari server sql menggunakan perintah sqoop: Basis data sql: Tabel sql MyDB: dbo.TestTable sqoop import -connect 'jdbc:sqlserver://xx.xxx.xxx.xxx;database=MyDB' --username Cread -P --table TestTable...
627 dilihat
schedule 18.01.2024

Hive: fungsi agregat pada kolom array
Saya bertanya-tanya apakah mungkin untuk menjalankan fungsi agregat pada kolom yang memiliki tipe data array. Tabel dibuat sebagai berikut: CREATE EXTERNAL TABLE tmp_table ( start_date array<string>, customer_id string ) ROW FORMAT...
1040 dilihat
schedule 16.12.2023

impor sqoop tidak mengidentifikasi tabel mysql yang menampilkan Kesalahan ClassNotFountException
Saya memiliki tabel "pelanggan" mysql dan mencoba mengimpor data dari lokasi mysql ke hdfs menggunakan sqoop import. Di bawah ini adalah versi yang saya instal di mesin saya: versi sqoop: 1.4.6 versi hive: 2.3.0 Versi Hadoop: 2.8.1 Perintah impor...
411 dilihat
schedule 06.12.2023

Cara menggabungkan beberapa file ORC (milik setiap partisi) dalam tabel ORC Hive yang Dipartisi menjadi satu file ORC besar
Saya memiliki tabel ORC yang dipartisi di Hive. Setelah memuat tabel dengan semua kemungkinan partisi yang saya dapatkan di HDFS - beberapa file ORC yaitu setiap direktori partisi di HDFS memiliki file ORC di dalamnya. Saya perlu menggabungkan semua...
1331 dilihat
schedule 11.12.2023

Bagaimana saya bisa terhubung ke Hive menggunakan pyspark?
Saya mencoba membuat tabel di HIVE. Tapi itu membuat folder seperti testdb.db di dalam folder spark-warehouse. Bagaimana saya bisa langsung menyimpan di HIVE seperti yang kami simpan ke database MySQL/MongoDB. conf =...
1699 dilihat
schedule 22.11.2023

Mengekspos Metadata Hive di Hive itu sendiri
Saya kira hal ini akan terjadi, namun ternyata tidak. Hive tidak memaparkan metadatanya sendiri dalam lingkungannya. Misalnya, seperti yang dilakukan Oracle, ini memungkinkan Anda menggunakan "user_tables" untuk tabel yang Anda buat. Saya...
93 dilihat
schedule 23.12.2023

Kelompok persentil sarang oleh dua variabel
Saya memiliki tabel Hive tempat saya ingin mencari persentil ke-10, median, dan persentil ke-90 dari suatu nilai berdasarkan lokasi/hari kerja. Maket tabel ada di bawah. Bagaimana cara menulis kueri sehingga kolom tabel keluaran adalah lokasi, hari...
1762 dilihat
schedule 18.11.2023

File direktori tidak disalin ke HDFS dengan perintah 'hadoop fs -put ‹my local path› ‹hdfs path›
Saya menyalin file yang diproses babi di sistem lokal ke jalur HDFS (yang ditautkan ke tabel HIVE) dengan memberikan perintah di bawah ini tetapi tidak menyalin. Langkah 1: data ada di jalur lokal saya [root@quickstart plantoutput]# ll total 4...
346 dilihat
schedule 27.12.2023

Cara mengakses tabel dari kluster Hive yang terletak di HDInsight dari Server Spark Lokal yang dibangun di Intellij
Saya tidak dapat mengakses dan membaca data dari tabel Hive yang terletak di HDInsight dari Mesin Virtual lokal saya tempat aplikasi dibangun di Intellij dan Maven. Bolehkah seseorang membantu saya apa saja Prasyarat untuk skenario ketika kita...
68 dilihat
schedule 13.11.2023

TSocket membaca 0 byte (kode THRIFTTRANSPORT): TTransportException('TSocket membaca 0 byte',)
[masukkan deskripsi gambar di sini] [1] Saat saya mengintegrasikan HIVE ke dalam HUE saya, saya melaporkan kesalahan. Saya mencoba selama berhari-hari, tetapi saya tidak dapat menyelesaikannya. Ada yang bisa bantu saya? Saya mencari di Google,...
3292 dilihat
schedule 08.11.2023