Я ищу быструю реализацию сканирования (сумма префиксов) в OpenCL. Лучшее, что я нашел, это Nvidia SDK, но он старый (2010 г.). Кто-нибудь знает какую-либо другую реализацию сканирования в OpenCL?
Код сканирования OpenCL
Ответы (2)
В OpenCL существует несколько реализаций операции сканирования с открытым исходным кодом:
- CLOGS, библиотека для высокоуровневых операций поверх OpenCL C++ API.
- Boost.Compute, вычислительная библиотека C++ GPU для OpenCL.
- VexCL, библиотека шаблонов векторных выражений C++ для OpenCL/CUDA.
- Bolt, библиотека шаблонов C++, оптимизированная для графических процессоров.
Автор CLOGS написал статью, сравнивающую производительность сканирования (и сортировки) операций в этих реализациях.
person
ddemidov
schedule
05.09.2015
если ваше устройство поддерживает 2.0, используйте для этого встроенные операции.
https://stackoverflow.com/a/32394920/4877550
http://developer.amd.com/community/blog/2014/11/17/opencl-2-0-device-enqueue/
person
eclipse0922
schedule
05.09.2015
Встроенные операции ограничены одной рабочей группой (несколько десятков потоков)
- person Bulat; 26.08.2016