Я пытался сделать FFT в OpenCL. У меня это сработало с таким ядром,
__kernel void butterfly(__global float2* twid, __global float2* X,
const int n,}
{
/* Butterfly structure*/
}
Я называю это ядром тысячи раз. Таким образом, чтение/запись в глобальную память занимает слишком много времени. Массив twid(float2) просто читается, никогда не обрабатывается, а массив X является типом массива READ & WRITE.
1.Какой наиболее подходящий тип памяти для этого? 2. Если я использую локальную память, смогу ли я передать ее другому ядру в качестве аргумента, не копируя ее в глобальную память?
Я новичок в OpenCL.