คำถามในหัวข้อ 'simd'

วิธีการเชื่อมโยงรันไทม์ตามความสามารถของ CPU บน linux
เป็นไปได้ไหมที่ไลบรารี linux (เช่น "libloader.so") โหลดไลบรารีอื่นเพื่อแก้ไขสัญลักษณ์ภายนอก ฉันมีโค้ดจำนวนมากที่ได้รับการคอมไพล์ตามเงื่อนไขเพื่อให้รองรับระดับ SIMD ( SSE2, AVX, AVX2 ) วิธีนี้ใช้ได้ผลดีหากแพลตฟอร์ม build เหมือนกับแพลตฟอร์มรันไทม์...
645 มุมมอง
schedule 02.01.2024

วิธีเขียนโค้ด a[i]=b[c[i]] บนฟังก์ชัน ARM NEON SIMD Intrinsic
ฉันกำลังพยายามแปลรหัส C/C++ นี้เป็นฟังก์ชัน SIMD Intrinsic for(int i=0 ; i < length ; i++) A[i] = B[C[i]]; ฉันสามารถแปลโค้ดด้านล่างได้ (C/C++) for(int i=0 ; i < length ; i++) A[i] = B[i]; ไปยังรหัส SIMD (โดยใช้ฟังก์ชัน...
931 มุมมอง
schedule 13.12.2023

เทมเพลตประเภทข้อมูล ComputeLibrary
ใน ARM ComputeLibrary เราสามารถมีออบเจ็กต์ Tensor ประเภทต่างๆ ได้ เมื่อเลือกประเภทของ Tensors เราจะส่งประเภทไปยังตัวเริ่มต้นของการจัดสรรของ Tensor เช่น float32 ที่นี่: my_tensor.allocator()->init(armcl::TensorInfo(shape_my_tensor, 1,...
44 มุมมอง
schedule 22.11.2023

_mm256_rem_epu64 ไม่พบภายในกับ GCC 10.3.0
ฉันพยายามเขียนการคูณเมทริกซ์ uint64_t 2x2 ต่อไปนี้อีกครั้งด้วยคำสั่ง AVX-512 แต่ GCC 10.3 ไม่พบ _mm256_rem_epu64 ที่อยู่ภายใน #include <cstdint> #include <immintrin.h> constexpr uint32_t LAST_9_DIGITS_DIVIDER = 1000000000;...
69 มุมมอง
schedule 13.11.2023