คำถามในหัวข้อ 'hadoop'

ใน Hadoop จะตรวจสอบจำนวนงานแผนที่ที่ทำงานบนแต่ละโหนดทาสได้อย่างไร
ฉันมีคลัสเตอร์ Hadoop ที่มีโหนดหลักเป็นโหนดหลักและอีก 7 โหนดที่กำหนดค่าเป็นทาสโดยแต่ละโหนดมี 8 คอร์และหน่วยความจำ 8 GB ฉันกำลังเล่นกับพารามิเตอร์ "mapred.tasktracker.map.tasks.maximum" และจำนวนทาสในไฟล์การกำหนดค่าทาส ตอนนี้...
1410 มุมมอง
schedule 18.01.2024

สิ่งพื้นฐานเกี่ยวกับ Hadoop และ Hive
ฉันเพิ่งเริ่มทำงานกับ Hadoop เมื่อเร็วๆ นี้ มีตารางชื่อ Checkout ที่ฉันเข้าถึงผ่าน Hive และด้านล่างนี้คือเส้นทางที่ข้อมูลไปยัง HDFS และข้อมูลอื่นๆ แล้วฉันจะได้ข้อมูลอะไรหากต้องอ่านสามบรรทัดด้านล่าง? Path...
766 มุมมอง
schedule 19.11.2023

รองรับ SAX Parser ใน Apache Pig
ฉันกำลังทำงานกับ UDF เพื่อประมวลผลไฟล์ XML บนคลัสเตอร์ Hadoop ฉันใช้ PIG เพื่อโหลดไฟล์ XML จากนั้นฉันใช้ UDF เพื่อทำให้โครงสร้างของข้อมูล XML เรียบลง การใช้งานปัจจุบันของฉันคือการใช้ตัวแยกวิเคราะห์ DOM และฉันไม่จำเป็นต้องรวมขวดตัวแยกวิเคราะห์ DOM...
247 มุมมอง
schedule 14.11.2023

ฟังก์ชัน Cascading ดำเนินการในเธรดเดี่ยวเป็นฟังก์ชันผู้ทำแผนที่ Hadoop หรือไม่
ฉันกำลังอ่านเอกสารประกอบบทที่ 5.2 ฟังก์ชั่น และฉันสงสัยว่าจะเกิดอะไรขึ้นกับโค้ดต่อไปนี้ มันควรจะทำงานได้ดีในสภาพแวดล้อมแบบมัลติเธรดหรือไม่? คำถามทั่วไปคือ Function สามารถเป็นแบบมัลติเธรดได้หรือไม่...
332 มุมมอง
schedule 28.11.2023

จัดกลุ่มตามในไฮฟ์บนตารางที่แบ่งพาร์ติชันให้แถวผลลัพธ์ที่ซ้ำกัน
ใช้รีลีส 0.11.0 ฉันได้รับผลลัพธ์ที่ไม่ถูกต้องเมื่อพยายามดำเนินการค้นหานี้ select t1.symbol, max(t1.maxts - t1.orderts) as diff from (select catid, symbol, max(cast(timestamp as double)*1000) as maxts, min(cast(timestamp as double)*1000) as...
2401 มุมมอง
schedule 19.12.2023

ไม่สามารถสร้างตารางภายนอกในกลุ่มเพื่อชี้ hbase หนึ่งได้
ฉันเป็นนักเรียนที่พยายามทำความเข้าใจว่า Hadoop ทั้งหมดทำงานอย่างไร ฉันใช้ cloudera บนเครื่อง 15 เครื่อง การกำหนดค่าดี ​​บริการทั้งหมดเป็นสีเขียว ฉันนำเข้าบรรทัด mysql 12k ภายใต้ hbase และทุกอย่างก็ใช้ได้ดีเช่นกัน ฉันต้องการสอบถามข้อมูลเหล่านี้...
1450 มุมมอง
schedule 12.01.2024

การประมวลผล XML ที่ซับซ้อนใน Hadoop เพื่อดึงข้อมูล
ฉันต้องการประมวลผล XML ที่จัดรูปแบบแล้วใน Hadoop ซึ่งค่อนข้างซับซ้อนและใหญ่มาก และยังมีลูปด้วย ฉันลองตัวเลือกต่อไปนี้: โหลด XML ลงใน Hive เป็นคอลัมน์เดียวและใช้คำสั่ง XPATH สร้างตาราง Hive โดยใช้ SerDe โหลด XML โดยใช้ PIG โดยใช้ XMLLoader...
795 มุมมอง
schedule 01.01.2024

Hive - ตรวจสอบว่าอาร์เรย์ในแต่ละแถวของตารางมีข้อมูลที่ตรงกันในคอลัมน์ของตารางอื่นหรือไม่
ฉันมีสองตารางที่มีคอลัมน์ดังที่แสดงด้านล่าง Posts: user STRING, tag_list ARRAY<STRING> Tags: tag STRING นี่คือข้อมูลตัวอย่างบางส่วนในตารางเหล่านั้น Posts: user1 help, pig user2 bigdata, hadoop, query, hiveql user1 hive,...
6309 มุมมอง
schedule 15.11.2023

1 Tasktracker สามารถรัน JVM หลายตัวได้หรือไม่
1 Tasktracker สามารถเรียกใช้ JVM หลายเครื่องได้หรือไม่ นี่คือสถานการณ์: สมมติว่ามี 2 ไฟล์ (A & B) และ 2 โหนดข้อมูล (D1 & D2) เมื่อคุณโหลด A สมมติว่ามันถูกแบ่งออกเป็น A1 & A2 บน D1 & D2 และเมื่อคุณโหลด B สมมติว่ามันถูกแบ่งออกเป็น B1 & B2 บน D1...
210 มุมมอง
schedule 16.12.2023

Apache Accumulo มี CAP-Type อะไรบ้าง
ในระหว่างการประเมินระบบแบบกระจายหลายระบบ ฉันได้พบกับทฤษฎีบท CAP ขออภัย ฉันไม่พบการจัดหมวดหมู่สำหรับ Apache Accumulo นี่คือคำถามที่แท้จริง: Apache Accumulo เป็นประเภทหมวกประเภทใด และเพราะเหตุใด
451 มุมมอง
schedule 09.11.2023

เพิ่มประสิทธิภาพการสืบค้น Hive ด้วย JOIN ซึ่งมีบันทึกนับล้านรายการ
ฉันมี 2 โต๊ะ- bpm_agent_data - 40 Million records , 5 Columns bpm_loan_data - 20 Million records, 5 Columns ตอนนี้ฉันเรียกใช้แบบสอบถามใน Hive- select count(bpm_agent_data.AgentID), count(bpm_loan_data.LoanNumber) from bpm_agent_data...
277 มุมมอง
schedule 17.01.2024

การเลือกคอลัมน์ในกลุ่ม
ฉันมีตารางลูกค้าที่มี 200 คอลัมน์ ฉันต้องการสร้างตารางอื่นจากตารางลูกค้าซึ่งควรมีเพียง 190 คอลัมน์ ฉันจะข้ามสองสามคอลัมน์ในกลุ่มจากตารางฐานได้อย่างไร
62 มุมมอง
schedule 30.11.2023

apache storm สร้างการใช้งาน bolt อย่างไร
หลังจากใช้โทโพโลยี apache storm ที่เรียบง่ายใน java ฉันพบ NPE ซึ่งทำให้เกิดความสับสน นี่เป็นวิธีการหลักของฉัน: TologyBuilder builder = new TopologyBuilder(); builder.setSpout("spout", new CustomSpout(true), 4); final CustomBolt bolt = new...
280 มุมมอง
schedule 05.01.2024

เหตุใดจำนวนตัวลดจึงมากกว่าที่ฉันระบุไว้ใน Hadoop
นี่คือผลลัพธ์บนคอนโซลของงาน MR ของฉัน งานสำเร็จลุล่วงไปด้วยดี แต่ฉันมีสองข้อกังวล 1) ฉันระบุ -D mapred.reduce.slowstart.completed.maps=0.75 อย่างไรก็ตามตัวลดไม่เริ่มทำงานเมื่อแผนที่เสร็จสิ้น 75% ดังที่แสดงด้านล่าง 2) ฉันระบุ -D...
187 มุมมอง
schedule 10.12.2023

ข้อผิดพลาดแปลก ๆ ในคลาส mapreduce
ข้อผิดพลาดนี้ดูเหมือนเล็กน้อย แต่จะไม่หายไป ฉันได้กำหนดคลาสต่อไปนี้: import java.io.IOException; import java.util.Iterator; import java.util.StringTokenizer; import org.apache.hadoop.fs.Path; import org.apache.hadoop.io.IntWritable; import...
5277 มุมมอง
schedule 13.11.2023

ข้อผิดพลาดในการเข้าถึง Hbase
เมื่อฉันพยายามให้สิทธิ์การเข้าถึงแก่ผู้ใช้ใน hbase ฉันได้รับข้อผิดพลาดต่อไปนี้: grant 'root', 'RWXCA' ERROR: org.apache.hadoop.hbase.coprocessor.CoprocessorException: java.net.ConnectException: Connection refused at...
794 มุมมอง
schedule 12.01.2024

ตัวทำแผนที่ Hadoop และข้อผิดพลาดประเภทค่าตัวลดไม่ตรงกัน
ฉันยังใหม่กับ Hadoop และพบปัญหานี้ ฉันกำลังพยายามเปลี่ยนค่า Text, Integer เริ่มต้นสำหรับตัวลดเป็น Text, Text ฉันต้องการแมป Text, IntWritable จากนั้นในตัวลดฉันต้องการมี 2 ตัวนับ ขึ้นอยู่กับว่าค่าคืออะไร จากนั้นเขียนตัวนับ 2 ตัวนั้นใน Text...
1481 มุมมอง
schedule 16.11.2023

Oozie รันเวิร์กโฟลว์อีกครั้งจากโหนดซึ่งถูกปิดการทำงานครั้งล่าสุด
ฉันกำลังใช้การกระทำ MR ใน oozie และต้องการใช้ฟังก์ชันการระงับ/ดำเนินการต่อโดย oozie บน MR ปัญหา - อย่างไรก็ตาม เมื่อเราเรียก 'ระงับ' บน Oozie ซึ่งไม่ได้หยุดงาน Hadoop แต่จะอัปเดตสถานะ oozie เท่านั้น ในขณะที่งาน Hadoop ยังคงทำงานต่อไปจนเสร็จสิ้น...
3486 มุมมอง
schedule 16.12.2023

การตั้งเวลา oozie สำหรับแอปพลิเคชัน c #
ฉันใช้ oozie-4.1.0 ใน windows ฉันต้องการกำหนดเวลาแอปพลิเคชัน c# ผ่าน oozie เท่าที่ฉันรู้ oozie รองรับเฉพาะ java,pig,hive เท่านั้น ใครสามารถบอกฉันได้ว่ามีการสนับสนุนในการกำหนดเวลาแอปพลิเคชัน c # หรือไม่
132 มุมมอง
schedule 29.10.2023

Namenode และ Datanode ไม่ได้เริ่มทำงานใน Hadoop
ฉันติดตั้ง Hadoop 2.6.0 ในแล็ปท็อปที่ใช้ Ubuntu 14.04LTS ฉันสตาร์ท hadoop daemons ด้วยการรัน start-all.sh แต่เมื่อฉันพิมพ์ jps มีเพียง 4 เท่านั้นที่ทำงานอยู่ 10545 SecondaryNameNode 10703 ResourceManager 11568 Jps 10831 NodeManager...
14536 มุมมอง
schedule 15.12.2023