Saya menjalankan konversi PDF ke gambar sederhana menggunakan perpustakaan Python PDF2Image. Saya pasti dapat memahami bahwa ambang batas memori maksimal sedang dilewati oleh perpustakaan ini untuk sampai pada kesalahan ini. Namun, PDF berukuran 6,6 MB (kira-kira), lalu mengapa dibutuhkan memori GB untuk menimbulkan kesalahan memori?
Python 3.7.0 (v3.7.0:1bf9cc5093, Jun 27 2018, 04:06:47) [MSC v.1914 32 bit (Intel)] on win32
Type "help", "copyright", "credits" or "license" for more information.
>>> from pdf2image import convert_from_path
>>> pages = convert_from_path(r'C:\Users\aakashba598\Documents\pwc-annual-report-2017-2018.pdf', 200)
Exception in thread Thread-3:
Traceback (most recent call last):
File "C:\Users\aakashba598\AppData\Local\Programs\Python\Python37-32\lib\threading.py", line 917, in _bootstrap_inner
self.run()
File "C:\Users\aakashba598\AppData\Local\Programs\Python\Python37-32\lib\threading.py", line 865, in run
self._target(*self._args, **self._kwargs)
File "C:\Users\aakashba598\AppData\Local\Programs\Python\Python37-32\lib\subprocess.py", line 1215, in _readerthread
buffer.append(fh.read())
MemoryError
Selain itu, apa solusi yang mungkin untuk mengatasi hal ini?
Pembaruan: Saat saya mengurangi parameter dpi dari fungsi convert_from_path, fungsinya sangat bagus. Namun gambar yang dihasilkan berkualitas rendah (karena alasan yang jelas). Apakah ada cara untuk memperbaikinya? Seperti pembuatan gambar batch demi batch dan membersihkan memori setiap saat. Jika ada jalan, bagaimana cara melakukannya?