Saya setelah sedikit memahami, saya tidak terjebak pada apa pun tetapi saya mencoba memahami sesuatu dengan lebih baik.
Saat memuat gudang data, mengapa selalu disarankan agar kita memuat data ke penyimpanan blob atau data lake terlebih dahulu? Saya memahami bahwa mengambil data dari sana sangatlah cepat, namun menurut pengalaman saya, ada beberapa kendala. Yang pertama adalah adanya batasan ukuran file dan jika Anda memuat terlalu banyak data ke dalam 1 file seperti yang saya lihat terjadi, hal itu menyebabkan kesalahan pemuatan sehingga kita harus mengalihkan pemuatan ke tambahan. Ini membawa saya ke masalah kedua saya, saya selalu berpikir tujuan memuat ke penyimpanan blob adalah membuang semua data di sana sehingga Anda dapat mengaksesnya di masa depan tanpa membebani sistem front-end, jika saya tidak dapat melakukan itu karena dari batas file lalu apa gunanya menggunakan penyimpanan blob, sebaiknya kita memuat data langsung ke tabel pementasan. Sepertinya ini adalah langkah yang tidak perlu bagi saya ketika saya pernah menjalankan gudang data di masa lalu tanpa melibatkan bagian ini dan bagi saya mereka telah bekerja lebih baik.
Bagaimanapun pemahaman saya tentang bagian ini tidak sebaik yang saya inginkan, dan saya telah mencoba mencari artikel yang menjawab pertanyaan-pertanyaan spesifik ini tetapi tidak ada yang benar-benar menjelaskan konsep tersebut kepada saya dengan benar. Bantuan atau tautan apa pun ke artikel bagus yang dapat saya baca akan sangat saya hargai.