Вопросы по теме 'simd'

Как сделать привязку во время выполнения на основе возможностей процессора в Linux
Возможно ли, чтобы библиотека Linux (например, «libloader.so») загружала другую библиотеку для разрешения любых внешних символов? У меня есть целая куча кода, который условно компилируется для поддержки уровня SIMD (SSE2, AVX, AVX2). Это прекрасно...
645 просмотров
schedule 02.01.2024

Как закодировать a[i]=b[c[i]] на внутренней функции ARM NEON SIMD
Я пытаюсь перевести этот код C/C++ во встроенную функцию SIMD. for(int i=0 ; i < length ; i++) A[i] = B[C[i]]; Я могу перевести приведенный ниже код (C/C++) for(int i=0 ; i < length ; i++) A[i] = B[i]; в код SIMD...
931 просмотров
schedule 13.12.2023

Шаблоны типов данных ComputeLibrary
В ARM ComputeLibrary у нас может быть объект Tensor различных типов. При выборе типа тензоров мы передаем тип инициализатору распределителя тензора, например, float32 здесь: my_tensor.allocator()->init(armcl::TensorInfo(shape_my_tensor, 1,...
44 просмотров
schedule 22.11.2023

_mm256_rem_epu64 встроенный не найден с GCC 10.3.0
Я пытаюсь переписать следующее умножение матриц uint64_t 2x2 с помощью AVX-512 инструкций, но GCC 10.3 не находит _mm256_rem_epu64 встроенных. #include <cstdint> #include <immintrin.h> constexpr uint32_t LAST_9_DIGITS_DIVIDER =...
69 просмотров
schedule 13.11.2023