没有合适的资源?快使用搜索试试~ 我知道了~
broadwell_multiplication:CC ++ asm中的低级大整数算术子例程,已针对Broadwell和Zen2...
共120个文件
py:62个
cpp:38个
h:12个
需积分: 12 0 下载量 13 浏览量
2021-03-14
14:26:29
上传
评论
收藏 183KB ZIP 举报
温馨提示
C / C ++ / asm中的低级大整数算术子例程。 mul8_zen()与GMP子程序gmpn_mul(,, 8, , 8)在Skylake和Ryzen上)相比快512位(8肢)。 toom22_mul16_broadwell()乘16肢数字的速度比gmpn_mul(,, 16, , 16)快。 toom22_deg2_broadwell()相较于gmpn_toom22_mul() ,k gmpn_toom22_mul()数的乘法速度更快,其中k为2的小数。 状态 工作正在进行中。 代码需要清理。 某些子例程可能无法按预期工作。 但是,如果发布了该过程的基准,则该过程将经过全面测试,并且预计不会有错误。 目前,我的代码至少在以下肢体尺寸方面胜过GMP:6、7、8、16、24、32、48、64、127。 快速开始 python2 configure.py ninja automa
资源推荐
资源详情
资源评论
收起资源包目录
broadwell_multiplication:CC ++ asm中的低级大整数算术子例程,已针对Broadwell和Zen2 CPU进行了优化 (120个子文件)
benchmark-internal-align.c 2KB
benchmark-internal.c 1KB
test_mul_4x_zen_5arg.c 464B
test_mul_n_zen_4arg.c 445B
benchmark_sub.cpp 6KB
test_toom22_generic.cpp 3KB
test_toom22_xx.cpp 3KB
test_shr.cpp 3KB
experiment_with_movq.cpp 3KB
benchm_bdiv_dbm1c_4k.cpp 2KB
benchmark_toom22_xx.cpp 2KB
test_mpn_sub.cpp 2KB
benchm_bdiv_dbm1c_4k_inplace.cpp 2KB
test_mpn_mul2_add.cpp 2KB
test_mpn_sub_inplace.cpp 2KB
test_mpn_sub_4k.cpp 2KB
test_mpn_add_4k.cpp 2KB
test_mpn_add_2_4arg.cpp 2KB
benchmark-toom22.cpp 2KB
test_addmul_8x3.cpp 2KB
test_mpn_sub_2k_plus2_inplace.cpp 1KB
benchmark_toom22_broadwell_t.cpp 1KB
test_mpn_add_4k_plus2_4arg.cpp 1KB
test_bdiv_dbm1c_4k_inplace.cpp 1KB
benchmark8.cpp 1KB
test_bdiv_dbm1c_4k.cpp 1KB
test_mul_8shifts.cpp 1KB
test4.cpp 1KB
test_mpn_less.cpp 1KB
benchmark16.cpp 1KB
test_itch_broadwell.cpp 984B
benchmark-toom22_2x_loud.cpp 948B
test8.cpp 915B
test_2arg.cpp 743B
test_twice.cpp 740B
benchmark-toom22_1x_loud.cpp 622B
test_whatever_mul.cpp 550B
test6.cpp 530B
benchmark6.cpp 524B
test16.cpp 459B
benchmark_mul_n_zen_4arg.cpp 431B
benchmark_mul_4x_zen_5arg.cpp 417B
.gitignore 27B
toom22_generic.h 43KB
test-internal.h 3KB
toom33.h 2KB
test-toom22_generic-internal.h 2KB
benchmark-dynamic.h 2KB
bordeless-alloc.h 1KB
test-mpn_add_4k-internal.h 1KB
dump-number.h 994B
test-mpn_sub-internal.h 778B
shift_avx2.h 634B
random-number.h 367B
cstdint_gmp.h 37B
build.ninja.in 12KB
README.md 4KB
gen_mul11.py 41KB
gen_mul10_zen.py 30KB
gen_mul8x2.py 29KB
gen_mul8_zen_noRZ-108.py 28KB
gen_mul8_zen.py 20KB
gen_mul4.py 19KB
gen_addmul_8x3.py 17KB
gen_mul11_ryzen.py 16KB
gen_mul8_zen_RZ.py 16KB
gen_mul11_bwl.py 16KB
gen_toom22_interpolate.py 16KB
gen_mul8_aligned.py 12KB
configure.py 12KB
gen_mul8_skylake.py 11KB
gen_mul6_rz.py 11KB
gen_mul8_broadwell_125.py 10KB
gen_mul8_store1.py 10KB
gen_mul_n_zen_4arg.py 9KB
gen_mul5_aligned.py 9KB
gen_mul7_broadwell.py 9KB
gen_mul7_2arg.py 8KB
gen_mul7_t03.py 8KB
gen_mul6.py 7KB
gen_mul6_aligned.py 7KB
gen_mul_4x_zen.py 7KB
gen_mpn_sub.py 6KB
gen_add_sub.py 5KB
gen_bdiv_dbm1c_4k.py 4KB
gen_mpn_add_2_4arg.py 4KB
gen_mul6_zen.py 3KB
gen_mul3.py 3KB
gen_mul7_aligned.py 3KB
gen_shr1_9k_plus1_avx2.py 3KB
gen_mul7_trice.py 3KB
gen_mpn_mul2_add_4k.py 3KB
gen_bdiv_dbm1c_4k_inplace.py 2KB
gen_shr1_6k_plus1_avx2.py 2KB
gen_test_toom22_broadwell_t.py 2KB
gen_mpn_sub_4k_inplace.py 2KB
gen_shr1_10_avx2.py 2KB
gen_mpn_sub_1x.py 2KB
gen_mpn_add_4k_inplace.py 2KB
gen_mpn_less_3arg_hole.py 2KB
共 120 条
- 1
- 2
资源评论
李青廷Austin
- 粉丝: 21
- 资源: 4612
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功