Pertanyaan tentang topik tersebut 'simd'

Bagaimana cara melakukan runtime binding berdasarkan kemampuan CPU di linux
Apakah mungkin perpustakaan linux (mis. "libloader.so") memuat perpustakaan lain untuk menyelesaikan simbol eksternal? Saya punya banyak kode yang dikompilasi secara kondisional agar level SIMD didukung ( SSE2, AVX, AVX2 ). Ini berfungsi dengan...
645 dilihat
schedule 02.01.2024

Cara membuat kode a[i]=b[c[i]] pada fungsi Intrinsik ARM NEON SIMD
Saya mencoba menerjemahkan kode C/C++ ini ke fungsi SIMD Intrinsik. for(int i=0 ; i < length ; i++) A[i] = B[C[i]]; Saya dapat menerjemahkan kode di bawah ini (C/C++) for(int i=0 ; i < length ; i++) A[i] = B[i]; ke kode...
931 dilihat
schedule 13.12.2023

Templat tipe data ComputeLibrary
Di ARM ComputeLibrary , kita dapat memiliki berbagai jenis objek Tensor. Saat memilih tipe Tensor, kita meneruskan tipe tersebut ke initalis pengalokasi Tensor, seperti float32 di sini:...
44 dilihat
schedule 22.11.2023

_mm256_rem_epu64 intrinsik tidak ditemukan dengan GCC 10.3.0
Saya mencoba menulis ulang perkalian matriks uint64_t 2x2 berikut dengan instruksi AVX-512 , tetapi GCC 10.3 tidak menemukan _mm256_rem_epu64 intrinsik. #include <cstdint> #include <immintrin.h> constexpr uint32_t...
69 dilihat
schedule 13.11.2023