หลังจากทำความเข้าใจมาบ้างแล้ว ฉันไม่ได้ติดอยู่กับสิ่งใดเลย แต่ฉันพยายามเข้าใจบางสิ่งให้ดีขึ้น
เมื่อโหลดคลังข้อมูล เหตุใดจึงแนะนำให้เราโหลดข้อมูลลงในพื้นที่จัดเก็บ Blob หรือ Data Lake ก่อนเสมอ ฉันเข้าใจว่าการดึงข้อมูลจากที่นั่นทำได้เร็วมาก แต่จากประสบการณ์ของฉัน มีข้อผิดพลาดอยู่สองสามประการ อย่างแรกคือมีการจำกัดขนาดไฟล์ และหากคุณโหลดข้อมูลมากเกินไปลงใน 1 ไฟล์อย่างที่ผมเคยเจอมา มันทำให้การโหลดเกิดข้อผิดพลาด ซึ่งจุดนี้เราต้องเปลี่ยนการโหลดเป็นแบบเพิ่มหน่วย สิ่งนี้นำฉันไปสู่ประเด็นที่สองของฉัน ฉันคิดเสมอว่าจุดโหลดลงในที่เก็บข้อมูล Blob คือการดึงข้อมูลทั้งหมดไว้ในนั้นเพื่อให้คุณสามารถเข้าถึงได้ในอนาคตโดยไม่ต้องเน้นระบบส่วนหน้า หากฉันทำอย่างนั้นไม่ได้เพราะ ขีดจำกัดของไฟล์ แล้วอะไรคือจุดประสงค์ของการใช้ที่เก็บข้อมูล Blob เราอาจโหลดข้อมูลลงในตารางการแสดงโดยตรงเช่นกัน มันดูเหมือนเป็นขั้นตอนที่ไม่จำเป็นสำหรับฉันเมื่อฉันเคยใช้งานคลังข้อมูลในอดีตโดยไม่มีส่วนนี้เกี่ยวข้อง และสำหรับฉันคลังข้อมูลทำงานได้ดีขึ้น
อย่างไรก็ตาม ความเข้าใจในส่วนนี้ของฉันยังไม่ดีเท่าที่ฉันต้องการ และฉันพยายามค้นหาบทความที่ตอบคำถามเฉพาะเหล่านี้ แต่ไม่มีผู้ใดอธิบายแนวคิดนี้ให้ฉันได้อย่างถูกต้องจริงๆ ความช่วยเหลือหรือลิงก์ไปยังบทความดีๆ ที่ฉันสามารถอ่านได้จะได้รับการชื่นชมมาก