Saya telah mencoba melakukan FFT di OpenCL. Ini berhasil bagi saya dengan Kernel seperti ini,
__kernel void butterfly(__global float2* twid, __global float2* X,
const int n,}
{
/* Butterfly structure*/
}
Saya menyebutnya Kernel ribuan kali. Jadi BACA/TULIS ke memori global memakan waktu terlalu lama. Array twid(float2) hanya dibaca, tidak pernah dimanipulasi dan array X adalah tipe array READ & WRITE.
1.Jenis memori manakah yang paling cocok untuk ini? 2. Jika saya menggunakan memori lokal, apakah saya dapat meneruskannya ke Kernel lain sebagai argumen tanpa menyalinnya ke memori global?
Saya seorang pemula di OpenCL.