Saya mencari implementasi scan(prefixsum) yang cepat di OpenCL. Hal terbaik yang saya temukan ada di Nvidia SDK tetapi sudah lama (2010). Adakah yang tahu implementasi lain dari Scan di OpenCL?
Kode pemindaian OpenCL
Jawaban (2)
Ada beberapa implementasi operasi pemindaian sumber terbuka di OpenCL:
- CLOGS, perpustakaan untuk operasi tingkat tinggi di atas OpenCL C++ API.
- Boost.Compute, Library Komputasi GPU C++ untuk OpenCL.
- VexCL, pustaka template ekspresi vektor C++ untuk OpenCL/CUDA.
- Bolt, pustaka template C++ yang dioptimalkan untuk GPU.
Penulis CLOGS menulis makalah yang membandingkan kinerja pemindaian (dan penyortiran) operasi dalam implementasi ini.
person
ddemidov
schedule
05.09.2015
jika perangkat Anda mendukung 2.0, gunakan operasi bawaan untuk itu.
https://stackoverflow.com/a/32394920/4877550
http://developer.amd.com/community/blog/2014/11/17/opencl-2-0-device-enqueue/
person
eclipse0922
schedule
05.09.2015
Operasi bawaan terbatas pada satu kelompok kerja (beberapa lusin thread)
- person Bulat; 26.08.2016