Kode pemindaian OpenCL

Saya mencari implementasi scan(prefixsum) yang cepat di OpenCL. Hal terbaik yang saya temukan ada di Nvidia SDK tetapi sudah lama (2010). Adakah yang tahu implementasi lain dari Scan di OpenCL?


person Shewartz    schedule 05.09.2015    source sumber


Jawaban (2)


Ada beberapa implementasi operasi pemindaian sumber terbuka di OpenCL:

  • CLOGS, perpustakaan untuk operasi tingkat tinggi di atas OpenCL C++ API.
  • Boost.Compute, Library Komputasi GPU C++ untuk OpenCL.
  • VexCL, pustaka template ekspresi vektor C++ untuk OpenCL/CUDA.
  • Bolt, pustaka template C++ yang dioptimalkan untuk GPU.

Penulis CLOGS menulis makalah yang membandingkan kinerja pemindaian (dan penyortiran) operasi dalam implementasi ini.

person ddemidov    schedule 05.09.2015

jika perangkat Anda mendukung 2.0, gunakan operasi bawaan untuk itu.

https://stackoverflow.com/a/32394920/4877550

http://developer.amd.com/community/blog/2014/11/17/opencl-2-0-device-enqueue/

person eclipse0922    schedule 05.09.2015
comment
Operasi bawaan terbatas pada satu kelompok kerja (beberapa lusin thread) - person Bulat; 26.08.2016