Saya memiliki sistem yang membaca data dari berbagai sumber dan menyimpannya di MongoDB. Data yang saya terima sudah dikodekan dengan benar dalam utf-8 atau unicode. Dokumen memiliki keterkaitan yang longgar dan skema sangat bervariasi, jika Anda mau.
Sesekali, dokumen memiliki nilai bidang yang merupakan data biner murni, seperti gambar JPEG. Saya tahu cara membungkus nilai itu dalam objek bson.binary.Binary
untuk menghindari pengecualian bson.errors.InvalidStringData
.
Apakah ada cara untuk mengetahui bagian mana dari dokumen yang membuat driver pymongo memunculkan bson.errors.InvalidStringData
, atau apakah saya harus mencoba dan mengonversi setiap bidang untuk menemukannya?
(+Jika kebetulan objek biner merupakan string unicode atau utf-8 yang valid, objek tersebut akan disimpan sebagai string dan tidak masalah)
InvalidStringData
dalam kasus Anda? Saya bertanya karena Anda mengatakan bahwa data dikodekan dalam UTF-8, tetapi, seperti yang disebutkan dalam dokumentasi, kesalahan ini muncul saat membaca data non-UTF8 (dokumen). Terima kasih. - person alecxe   schedule 17.05.2013