Вопросы по теме 'simd'
Как сделать привязку во время выполнения на основе возможностей процессора в Linux
Возможно ли, чтобы библиотека Linux (например, «libloader.so») загружала другую библиотеку для разрешения любых внешних символов?
У меня есть целая куча кода, который условно компилируется для поддержки уровня SIMD (SSE2, AVX, AVX2). Это прекрасно...
645 просмотров
schedule
02.01.2024
Как закодировать a[i]=b[c[i]] на внутренней функции ARM NEON SIMD
Я пытаюсь перевести этот код C/C++ во встроенную функцию SIMD.
for(int i=0 ; i < length ; i++)
A[i] = B[C[i]];
Я могу перевести приведенный ниже код (C/C++)
for(int i=0 ; i < length ; i++)
A[i] = B[i];
в код SIMD...
931 просмотров
schedule
13.12.2023
Шаблоны типов данных ComputeLibrary
В ARM ComputeLibrary у нас может быть объект Tensor различных типов. При выборе типа тензоров мы передаем тип инициализатору распределителя тензора, например, float32 здесь:
my_tensor.allocator()->init(armcl::TensorInfo(shape_my_tensor, 1,...
44 просмотров
schedule
22.11.2023
_mm256_rem_epu64 встроенный не найден с GCC 10.3.0
Я пытаюсь переписать следующее умножение матриц uint64_t 2x2 с помощью AVX-512 инструкций, но GCC 10.3 не находит _mm256_rem_epu64 встроенных.
#include <cstdint>
#include <immintrin.h>
constexpr uint32_t LAST_9_DIGITS_DIVIDER =...
69 просмотров
schedule
13.11.2023