คำถามในหัวข้อ 'simd'
วิธีการเชื่อมโยงรันไทม์ตามความสามารถของ CPU บน linux
เป็นไปได้ไหมที่ไลบรารี linux (เช่น "libloader.so") โหลดไลบรารีอื่นเพื่อแก้ไขสัญลักษณ์ภายนอก
ฉันมีโค้ดจำนวนมากที่ได้รับการคอมไพล์ตามเงื่อนไขเพื่อให้รองรับระดับ SIMD ( SSE2, AVX, AVX2 ) วิธีนี้ใช้ได้ผลดีหากแพลตฟอร์ม build เหมือนกับแพลตฟอร์มรันไทม์...
645 มุมมอง
schedule
02.01.2024
วิธีเขียนโค้ด a[i]=b[c[i]] บนฟังก์ชัน ARM NEON SIMD Intrinsic
ฉันกำลังพยายามแปลรหัส C/C++ นี้เป็นฟังก์ชัน SIMD Intrinsic
for(int i=0 ; i < length ; i++)
A[i] = B[C[i]];
ฉันสามารถแปลโค้ดด้านล่างได้ (C/C++)
for(int i=0 ; i < length ; i++)
A[i] = B[i];
ไปยังรหัส SIMD (โดยใช้ฟังก์ชัน...
931 มุมมอง
schedule
13.12.2023
เทมเพลตประเภทข้อมูล ComputeLibrary
ใน ARM ComputeLibrary เราสามารถมีออบเจ็กต์ Tensor ประเภทต่างๆ ได้ เมื่อเลือกประเภทของ Tensors เราจะส่งประเภทไปยังตัวเริ่มต้นของการจัดสรรของ Tensor เช่น float32 ที่นี่:
my_tensor.allocator()->init(armcl::TensorInfo(shape_my_tensor, 1,...
44 มุมมอง
schedule
22.11.2023
_mm256_rem_epu64 ไม่พบภายในกับ GCC 10.3.0
ฉันพยายามเขียนการคูณเมทริกซ์ uint64_t 2x2 ต่อไปนี้อีกครั้งด้วยคำสั่ง AVX-512 แต่ GCC 10.3 ไม่พบ _mm256_rem_epu64 ที่อยู่ภายใน
#include <cstdint>
#include <immintrin.h>
constexpr uint32_t LAST_9_DIGITS_DIVIDER = 1000000000;...
69 มุมมอง
schedule
13.11.2023