คำถามในหัวข้อ 'hive'
สิ่งพื้นฐานเกี่ยวกับ Hadoop และ Hive
ฉันเพิ่งเริ่มทำงานกับ Hadoop เมื่อเร็วๆ นี้ มีตารางชื่อ Checkout ที่ฉันเข้าถึงผ่าน Hive และด้านล่างนี้คือเส้นทางที่ข้อมูลไปยัง HDFS และข้อมูลอื่นๆ แล้วฉันจะได้ข้อมูลอะไรหากต้องอ่านสามบรรทัดด้านล่าง?
Path...
766 มุมมอง
schedule
19.11.2023
จัดกลุ่มตามในไฮฟ์บนตารางที่แบ่งพาร์ติชันให้แถวผลลัพธ์ที่ซ้ำกัน
ใช้รีลีส 0.11.0 ฉันได้รับผลลัพธ์ที่ไม่ถูกต้องเมื่อพยายามดำเนินการค้นหานี้
select t1.symbol, max(t1.maxts - t1.orderts) as diff from
(select catid, symbol, max(cast(timestamp as double)*1000) as maxts, min(cast(timestamp as double)*1000) as...
2401 มุมมอง
schedule
19.12.2023
ไม่สามารถสร้างตารางภายนอกในกลุ่มเพื่อชี้ hbase หนึ่งได้
ฉันเป็นนักเรียนที่พยายามทำความเข้าใจว่า Hadoop ทั้งหมดทำงานอย่างไร ฉันใช้ cloudera บนเครื่อง 15 เครื่อง การกำหนดค่าดี บริการทั้งหมดเป็นสีเขียว ฉันนำเข้าบรรทัด mysql 12k ภายใต้ hbase และทุกอย่างก็ใช้ได้ดีเช่นกัน ฉันต้องการสอบถามข้อมูลเหล่านี้...
1450 มุมมอง
schedule
12.01.2024
การประมวลผล XML ที่ซับซ้อนใน Hadoop เพื่อดึงข้อมูล
ฉันต้องการประมวลผล XML ที่จัดรูปแบบแล้วใน Hadoop ซึ่งค่อนข้างซับซ้อนและใหญ่มาก และยังมีลูปด้วย
ฉันลองตัวเลือกต่อไปนี้:
โหลด XML ลงใน Hive เป็นคอลัมน์เดียวและใช้คำสั่ง XPATH
สร้างตาราง Hive โดยใช้ SerDe
โหลด XML โดยใช้ PIG โดยใช้ XMLLoader...
795 มุมมอง
schedule
01.01.2024
Hive - ตรวจสอบว่าอาร์เรย์ในแต่ละแถวของตารางมีข้อมูลที่ตรงกันในคอลัมน์ของตารางอื่นหรือไม่
ฉันมีสองตารางที่มีคอลัมน์ดังที่แสดงด้านล่าง
Posts:
user STRING,
tag_list ARRAY<STRING>
Tags:
tag STRING
นี่คือข้อมูลตัวอย่างบางส่วนในตารางเหล่านั้น
Posts:
user1 help, pig
user2 bigdata, hadoop, query, hiveql
user1 hive,...
6309 มุมมอง
schedule
15.11.2023
เพิ่มประสิทธิภาพการสืบค้น Hive ด้วย JOIN ซึ่งมีบันทึกนับล้านรายการ
ฉันมี 2 โต๊ะ-
bpm_agent_data - 40 Million records , 5 Columns
bpm_loan_data - 20 Million records, 5 Columns
ตอนนี้ฉันเรียกใช้แบบสอบถามใน Hive-
select count(bpm_agent_data.AgentID), count(bpm_loan_data.LoanNumber) from bpm_agent_data...
277 มุมมอง
schedule
17.01.2024
การเลือกคอลัมน์ในกลุ่ม
ฉันมีตารางลูกค้าที่มี 200 คอลัมน์ ฉันต้องการสร้างตารางอื่นจากตารางลูกค้าซึ่งควรมีเพียง 190 คอลัมน์ ฉันจะข้ามสองสามคอลัมน์ในกลุ่มจากตารางฐานได้อย่างไร
62 มุมมอง
schedule
30.11.2023
ประทับวันที่ & เวลาไฮฟ์จาก unix_timestamp()
ฉันต้องการแทรกสองคอลัมน์ด้วยวันที่ปัจจุบัน (sysdate) และการประทับเวลา ฉันได้สร้างตารางและแทรกข้อมูลโดยใช้ unix_timestamp ฉันไม่สามารถแปลงเป็นรูปแบบการประทับวันที่และเวลาของกลุ่มได้
############ Hive create table #############
create table...
5067 มุมมอง
schedule
13.11.2023
Hive และ Hadoop ทำงานเฉพาะในพื้นที่เท่านั้น
ฉันได้กำหนดค่าคลัสเตอร์ Hadoop แบบ 3 โหนดแล้ว ฉันพยายามใช้ Hive ที่ด้านบนของมัน ดูเหมือนว่า Hive จะทำงานเฉพาะในโหมดโลคัลเท่านั้น ฉันได้ยินมาว่า Hive รับค่าจาก Hadoop เกี่ยวกับคลัสเตอร์ ดังนั้นฉันจึงทำงานใน Hadoop และดูเหมือนว่าจะทำงานในโหมด Local...
1314 มุมมอง
schedule
03.01.2024
avroserde ในกลุ่มอนุญาตให้อัปเดตหรือลบบันทึกหรือไม่
ฉันมีตารางในกลุ่มซึ่งสร้างโดยใช้ ROW FORMAT SERDE 'org.apache.hadoop.hive.serde2.avro.AvroSerDe'
กำลังพยายามอัปเดตบันทึก แต่ฉันได้รับข้อความแสดงข้อผิดพลาดต่อไปนี้:
FAILED: SemanticException [Error 10294]: Attempt to do update or delete using...
553 มุมมอง
schedule
28.10.2023
วิธี Sqoop CDC ตารางระบบจากเซิร์ฟเวอร์ sql
ฉันสามารถดึงตารางจากเซิร์ฟเวอร์ sql โดยใช้คำสั่ง sqoop:
ฐานข้อมูล Sql: ตาราง MyDB sql: dbo.TestTable
sqoop import
-connect 'jdbc:sqlserver://xx.xxx.xxx.xxx;database=MyDB'
--username Cread -P
--table TestTable...
627 มุมมอง
schedule
18.01.2024
Hive: ฟังก์ชันการรวมในคอลัมน์อาร์เรย์
ฉันสงสัยว่าเป็นไปได้หรือไม่ที่จะเรียกใช้ฟังก์ชันรวมบนคอลัมน์ที่มีประเภทข้อมูลอาร์เรย์
ตารางถูกสร้างขึ้นดังต่อไปนี้:
CREATE EXTERNAL TABLE tmp_table (
start_date array<string>,
customer_id string
) ROW FORMAT DELIMITED FIELDS...
1040 มุมมอง
schedule
16.12.2023
การนำเข้า sqoop ไม่ได้ระบุตาราง mysql ที่แสดงข้อผิดพลาด ClassNotFountException
ฉันมีตาราง "ลูกค้า" ของ mysql และลองนำเข้าข้อมูลจาก mysql ไปยังตำแหน่ง hdfs โดยใช้การนำเข้า sqoop ด้านล่างนี้เป็นเวอร์ชันที่ฉันติดตั้งบนเครื่องของฉัน: เวอร์ชัน sqoop: 1.4.6 เวอร์ชัน hive: 2.3.0 เวอร์ชัน Hadoop: 2.8.1
คำสั่งนำเข้า Sqoop:
sqoop...
411 มุมมอง
schedule
06.12.2023
วิธีรวมไฟล์ ORC หลายไฟล์ (เป็นของแต่ละพาร์ติชัน) ในตาราง Partitioned Hive ORC ให้เป็นไฟล์ ORC ขนาดใหญ่ไฟล์เดียว
ฉันมีตาราง ORC ที่แบ่งพาร์ติชันใน Hive หลังจากโหลดตารางด้วยพาร์ติชันที่เป็นไปได้ทั้งหมด ฉันจะได้รับ HDFS - ไฟล์ ORC หลายไฟล์ เช่น แต่ละไดเร็กทอรีพาร์ติชันบน HDFS มีไฟล์ ORC อยู่ในนั้น ฉันจำเป็นต้องรวมไฟล์ ORC...
1331 มุมมอง
schedule
11.12.2023
ฉันจะเชื่อมต่อกับไฮฟ์โดยใช้ pyspark ได้อย่างไร
ฉันกำลังพยายามสร้างตารางใน HIVE แต่กำลังสร้างโฟลเดอร์เช่น testdb.db ภายในโฟลเดอร์ spark-warehouse ฉันจะจัดเก็บโดยตรงใน HIVE ได้อย่างไรในขณะที่เราจัดเก็บไว้ในฐานข้อมูล MySQL/MongoDB
conf = SparkConf().setAppName("data_import")
sc =...
1699 มุมมอง
schedule
22.11.2023
การเปิดเผยข้อมูลเมตาของ Hive ใน Hive นั้นเอง
ฉันคาดหวังว่าสิ่งนี้จะเกิดขึ้น แต่ก็ดูเหมือนจะไม่เป็นเช่นนั้น Hive จะไม่เปิดเผยข้อมูลเมตาของตัวเองภายในสภาพแวดล้อม ตัวอย่างเช่น เช่นเดียวกับ Oracle อนุญาตให้คุณใช้ "user_tables" สำหรับตารางที่คุณสร้างขึ้น...
93 มุมมอง
schedule
23.12.2023
กลุ่มเปอร์เซ็นไทล์ไฮฟ์ด้วยตัวแปรสองตัว
ฉันมีตารางไฮฟ์ที่ฉันต้องการค้นหาเปอร์เซ็นไทล์ที่ 10 ค่ามัธยฐาน และเปอร์เซ็นไทล์ที่ 90 ของค่าตามสถานที่/วันทำงาน แบบจำลองของตารางอยู่ด้านล่าง ฉันจะเขียนแบบสอบถามเพื่อให้คอลัมน์ตารางผลลัพธ์เป็นตำแหน่ง วันทำงาน เปอร์เซ็นไทล์ที่ 10 ค่ามัธยฐาน...
1762 มุมมอง
schedule
18.11.2023
ไฟล์ไดเร็กทอรีไม่ได้คัดลอกไปยัง HDFS ด้วยคำสั่ง 'hadoop fs -put ‹my local path› ‹hdfs path›
ฉันกำลังคัดลอกไฟล์ประมวลผล pig ในระบบโลคัลไปยังเส้นทาง HDFS (ซึ่งเชื่อมโยงกับตาราง HIVE) โดยให้คำสั่งด้านล่าง แต่ไม่ได้คัดลอก
ขั้นตอนที่ 1: ข้อมูลอยู่ในเส้นทางในเครื่องของฉัน
[root@quickstart plantoutput]# ll
total 4
-rw-r--r-- 1 root root...
346 มุมมอง
schedule
27.12.2023
วิธีเข้าถึงตารางจากคลัสเตอร์ Hive ที่อยู่ใน HDInsight จาก Local Spark Server ที่สร้างบน Intellij
ฉันไม่สามารถเข้าถึงและอ่านข้อมูลจากตาราง Hive ที่อยู่ใน HDInsight จากอินสแตนซ์ในเครื่องของฉันที่แอปพลิเคชันสร้างบน Intellij และ Maven
ใครก็ได้โปรดช่วยฉันด้วยว่าข้อกำหนดเบื้องต้นสำหรับสถานการณ์สมมติเมื่อเราต้องการเขียนข้อมูลจาก Spark ไปยัง Hive...
68 มุมมอง
schedule
13.11.2023
TSocket อ่าน 0 ไบต์ (รหัส THRIFTTRANSPORT): TTransportException ('TSocket อ่าน 0 ไบต์',)
[ป้อนคำอธิบายรูปภาพที่นี่][1]เมื่อฉันรวม HIVE เข้ากับ HUE ของฉัน ฉันรายงานข้อผิดพลาด
ฉันพยายามมาหลายวันแต่ก็ไม่สามารถแก้ไขได้ ใครสามารถช่วยฉันได้บ้าง?
ฉันค้นหาใน Google แต่ก็ไม่ประสบความสำเร็จ
TSocket read 0 bytes
×
TSocket read 0 bytes...
3292 มุมมอง
schedule
08.11.2023