没有合适的资源?快使用搜索试试~ 我知道了~
温馨提示
SIMD无处不在 仅SIMDe标头库可在本身不支持它们的硬件上提供快速,可移植的实现,例如在ARM上调用函数。 如果硬件支持本机实现,则不会降低性能(例如,SSE / 在上全速运行,在上是等)。 这使通过一些关键方式将代码移植到其他体系结构变得更加容易: 首先,不是强迫您为每种体系结构重写所有内容,SIMDe使您几乎可以毫不费力地启动并运行端口。 然后,您可以开始将最关键性能的部分切换为本机内在函数,从而逐步提高性能。 SIMDe使(例如)SSE / AVX和NEON代码在同一实现中并排存在。 其次,SIMDe使您更容易编写针对您无法方便访问的扩展的代码。 您可以在没有模拟器的情况下在x86机器上运行NEON代码。 显然,您最终将要在要定位的实际硬件上进行测试,但是对于大多数开发而言,SIMDe可以提供一条更简单的途径。 SIMDe与大多数其他SIMD抽象层采用的方法截然不同,因
资源推荐
资源详情
资源评论
收起资源包目录
simde:SIMD指令集的实现适用于本机不支持它们的系统 (584个子文件)
.all-contributorsrc 5KB
Dockerfile.arm64 1KB
Dockerfile.arm7 1KB
meson.build 4KB
meson.build 2KB
meson.build 1KB
meson.build 1KB
meson.build 1016B
meson.build 869B
meson.build 15B
svml.c 2.55MB
avx2.c 1.34MB
avx.c 968KB
permutex2var.c 801KB
sse2.c 601KB
gfni.c 562KB
xop.c 505KB
permutexvar.c 460KB
min.c 434KB
max.c 434KB
adds.c 400KB
add.c 342KB
sse.c 329KB
shuffle.c 319KB
broadcast.c 290KB
mov.c 285KB
mmx.c 275KB
sub.c 265KB
subs.c 254KB
unpackhi.c 253KB
reinterpret.c 250KB
abs.c 241KB
avg.c 233KB
sse4.1.c 231KB
insert.c 206KB
st4.c 183KB
qtbx.c 177KB
cvts.c 176KB
fma.c 171KB
blend.c 156KB
and.c 152KB
qtbl.c 150KB
andnot.c 150KB
st3.c 144KB
mul.c 142KB
ssse3.c 127KB
rsra_n.c 115KB
sra_n.c 115KB
maddubs.c 114KB
rshr_n.c 113KB
set1.c 110KB
cast.c 106KB
shr_n.c 100KB
shl_n.c 99KB
extract.c 96KB
or.c 88KB
test.c 88KB
dup_lane.c 87KB
xor.c 85KB
sll.c 84KB
ceq.c 81KB
loadu.c 81KB
srlv.c 77KB
mls.c 77KB
ext.c 76KB
bsl.c 76KB
clt.c 76KB
cgt.c 76KB
cle.c 76KB
cge.c 76KB
cmpgt.c 74KB
qshl.c 73KB
div.c 73KB
madd.c 72KB
qsub.c 69KB
qadd.c 69KB
rshl.c 68KB
mla.c 67KB
zip.c 66KB
trn.c 66KB
uzp.c 66KB
set_lane.c 66KB
mul_lane.c 66KB
skel.c 65KB
cmpeq.c 65KB
abd.c 64KB
max.c 64KB
tst.c 63KB
aba.c 63KB
min.c 62KB
add.c 62KB
mul.c 61KB
sub.c 59KB
cmplt.c 58KB
fmadd.c 57KB
orn.c 57KB
bic.c 57KB
tbx.c 57KB
srl.c 57KB
sse4.2.c 57KB
共 584 条
- 1
- 2
- 3
- 4
- 5
- 6
资源评论
九九长安
- 粉丝: 20
- 资源: 4534
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- #P0015. 全排列 超级简单
- pta题库答案c语言之排序4统计工龄.zip
- pta题库答案c语言之树结构7堆中的路径.zip
- pta题库答案c语言之树结构3TreeTraversalsAgain.zip
- pta题库答案c语言之树结构2ListLeaves.zip
- pta题库答案c语言之树结构1树的同构.zip
- 基于C++实现民航飞行与地图简易管理系统可执行程序+说明+详细注释.zip
- pta题库答案c语言之复杂度1最大子列和问题.zip
- 三维装箱问题(Three-Dimensional Bin Packing Problem,3D-BPP)是一个经典的组合优化问题
- 以下是一些关于Linux线程同步的基本概念和方法.txt
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功