没有合适的资源?快使用搜索试试~ 我知道了~
clusterNet:适用于多个 GPU 的深度神经网络框架
共45个文件
cu:10个
cuh:9个
cpp:8个
需积分: 13 0 下载量 82 浏览量
2021-05-29
00:47:59
上传
评论
收藏 2.59MB ZIP 举报
温馨提示
集群网 适用于GPU集群的深度神经网络框架: 支持NVIDIA GPUDirect RDMA 简单的分布式计算: 矩阵C =点(A,B); //使用一个GPU 矩阵C = dotMPI(A,B); //使用板载或网络中所有可用的GPU 由于异步将内存复制到GPU,因此批次之间没有延迟: gpu.init_batch_allocator(X, y, 128); for(int i = 0; i < gpu.m_total_batches; i++) { gpu.allocate_next_batch_async(); //loads the next batch while you do computations result = gpu.dot(gpu.m_current_batch_X,w1); //do your computations here gpu.replace_cu
资源推荐
资源详情
资源评论
收起资源包目录
clusterNet-master.zip (45个子文件)
clusterNet-master
source
basicOps.cu 39KB
Layer.h 3KB
WikiNetDist.cpp 15KB
util.cuh 2KB
basicOps.cuh 9KB
batchAllocator.cpp 41KB
batchAllocator.h 3KB
WikiNetDist.h 2KB
clusterNet.cpp 37KB
Layer.cpp 14KB
test.cu 56KB
util.cu 11KB
DeepNeuralNetwork.cpp 18KB
8bit_floats.hdf5 3KB
WikiMaxoutNet_PCIe.h 2KB
WikiMaxoutNet_PCIe2.cpp 16KB
clusterNet.h 8KB
WikiMaxoutNet_PCIe2.h 2KB
WikiMaxoutNet.h 2KB
clusterKernels.cu 95KB
DeepNeuralNetwork.h 2KB
clusterKernels.cuh 9KB
WikiMaxoutNet_PCIe.cpp 15KB
WikiMaxoutNet.cpp 19KB
README.md 1KB
Makefile 1KB
tests
clusterNet_test.cu 21KB
crowdflower_y_test.hdf5 665KB
miniMNIST_test.cuh 99B
util_test.cu 1KB
miniMNIST_test.cu 15KB
batchAllocator_test.cu 23KB
mnist_mini_y.hdf5 4KB
mnist_mini_X.hdf5 1.5MB
basicOps_test.cuh 139B
numpy_arange_as_h5py.hdf5 6KB
batchAllocator_test.cuh 137B
crowdflower_X_test.hdf5 3.04MB
clusterNet_test.cuh 125B
testSuite.cu 567B
scipy_sparse_arange_as_h5py.hdf5 8KB
testSuite.cuh 43B
basicOps_test.cu 21KB
util_test.cuh 69B
.gitignore 32B
共 45 条
- 1
资源评论
小马甲不小
- 粉丝: 23
- 资源: 4714
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功