ubuntu 18.04 cuda 11.01 gpgpu-sim 裸机编译

1，环境

ubuntu 18.04

x86_64

cuda 11.01

gpgpu-sim master

commit 90ec3399763d7c8512cfe7dc193473086c38ca38

2，预备环境

一个比较新的 ubuntu 18.04，为了迎合 cuda 11.01 的版本需求

安装如下软件：

sudo apt-get install -y     xutils-dev bison zlib1g-dev flex libglu1-mesa-dev doxygen graphviz     python-pmw python-ply python-numpy python-matplotlib python-pip libpng-dev

3，安装cuda sdk 11.01

下载：

wget https://developer.download.nvidia.com/compute/cuda/11.0.1/local_installers/cuda_11.0.1_450.36.06_linux.run

安装在目录 /home/hanmeimei/cuda/cuda

 bash cuda_11.0.1_450.36.06_linux.run --silent --toolkit --toolkitpath=/home/hanmeimei/cuda/cuda

设置环境变量：

export CUDA_INSTALL_PATH=/home/hanmeimei/cuda/cuda

4，下载编译 gpgpu-sim master

git clone https://github.com/gpgpu-sim/gpgpu-sim_distribution.git

cd gpgpu-sim_distribution/

设置环境：

 . setup_environment

make -j

5. 编译运行 cuda app

此时 nvcc 是刚才安装的 nvcc

vim vectorAdd.cu

#include <iostream>
#include <cuda_runtime.h>#define N 16384// write kernel function of vector addition
__global__ void vecAdd(float *a, float *b, float *c, int n)
{int i = threadIdx.x + blockDim.x * blockIdx.x;if (i < n)c[i] = a[i] + b[i];
}int main()
{float *a, *b, *c;float *d_a, *d_b, *d_c;int size = N * sizeof(float);// allocate space for device copies of a, b, ccudaMalloc((void **)&d_a, size);cudaMalloc((void **)&d_b, size);cudaMalloc((void **)&d_c, size);// allocate space for host copies of a, b, c and setup input valuesa = (float *)malloc(size);b = (float *)malloc(size);c = (float *)malloc(size);for (int i = 0; i < N; i++){a[i] = i;b[i] = i * i;}// copy inputs to devicecudaMemcpy(d_a, a, size, cudaMemcpyHostToDevice);cudaMemcpy(d_b, b, size, cudaMemcpyHostToDevice);// launch vecAdd() kernel on GPUvecAdd<<<(N + 255) / 256, 256>>>(d_a, d_b, d_c, N);cudaDeviceSynchronize();// copy result back to hostcudaMemcpy(c, d_c, size, cudaMemcpyDeviceToHost);// verify resultfor (int i = 0; i < N; i++){if (a[i] + b[i] != c[i]){std::cout << "Error: " << a[i] << " + " << b[i] << " != " << c[i] << std::endl;break;}}std::cout << "Done!" << std::endl;// clean upfree(a);free(b);free(c);cudaFree(d_a);cudaFree(d_b);cudaFree(d_c);return 0;
}

编译：

nvcc vectorAdd.cu --cudart shared -o vectorAdd

拷贝配置文件：

cp gpgpu-sim_distribution/configs/tested-cfgs/SM7_QV100/config_volta_islip.icnt ./

 cp gpgpu-sim_distribution/configs/tested-cfgs/SM7_QV100/gpgpusim.config ./

运行app；

./vectorAdd

运行结束：

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.rhkb.cn/news/437554.html

如若内容造成侵权/违法违规/事实不符，请联系长河编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

ubuntu 18.04 cuda 11.01 gpgpu-sim 裸机编译

1，环境

2，预备环境

3，安装cuda sdk 11.01

4，下载编译 gpgpu-sim master

5. 编译运行 cuda app

相关文章

【Linux】几种常见配置文件介绍

VMware中Ubuntu系统Docker正常运行但网络不通（已解决）

ARM 架构、cpu

进程的创建、多任务及退出

60 序列到序列学习（seq2seq）_by《李沐：动手学深度学习v2》pytorch版

Percona Monitoring and Management

netty之NettyClient半包粘包处理、编码解码处理、收发数据方式

C++和OpenGL实现3D游戏编程【连载12】——游戏中音效的使用

SQL Server中关于个性化需求批量删除表的做法

Mysql 学习——项目实战

使用VBA快速将文本转换为Word表格

828华为云征文 | 基于华为云Flexus云服务器X搭建部署——AI知识库问答系统（使用1panel面板安装）

【算法】DFS 系列之穷举/暴搜/深搜/回溯/剪枝（上篇）

C语言语句、语句分类及注释

手机实时提取SIM卡打电话的信令声音-(题外、插播一条广告)

FireRedTTS - 小红书最新开源AI语音克隆合成系统免训练一键音频克隆本地一键整合包下载

Python基础语句教学

基于SSM的列车订票管理系统（含源码+sql+视频导入教程+文档+PPT）

C++继承与菱形继承(一文了解全部继承相关基础知识和面试点！)

Python | Leetcode Python题解之第452题用最少数量的箭引爆气球