[cuda 技术总结1] 第一次调用 cuda 库函数 耗时很长

news/2024/10/11 17:19:27/

在cuda编程中,发现调用cuda文件总耗时一百多ms,而纯kernel计算时间才3ms。

时间都去哪了?

查资料,trouble shooting,最后才发现这多出来的时间,就是第一次调用cuda api的时间:隐式cuda初始化,加载上下文…

目前还没找到什么好方法,只能提前做好初始化,把这段时间给隐藏掉(实际在整个代码执行中仍然存在):

  1. 调用.cu文件前提前初始化
cudaSetDevice(0);
cudaFree(0);

2.Linux下将驱动加载的默认模式改成“持久保存”

以 root 模式运行:

nvidia-smi -pm 1 

参考文献

[1] CUDA runtime API 第一次启动时,缓慢的问题
[2] cudamalloc 比 cudamemcpy 慢吗?
[3] 空闲状态下 NVIDIA-SMI的GPU使用率异常


http://www.ppmy.cn/news/881839.html

相关文章

求生之路2服务器模式修改参数,求生之路2参数修改控制台命令_求生之路2参数修改控制台命令方法_牛游戏网...

求生之路2是一款著名的僵尸恐怖题材的动作生存类游戏,游戏注重策略性和队友之间的默契配合团队精神。那么大家知道怎么对游戏参数进行控制台修改命令吗?不知道没关系,下面小编就为大家带来了其相关介绍,一起来看看吧。 求生之路2的…

[游戏技术]求生之路服务器参数配置

srcds.exe 服务器执行文件 server.cfg 服务器参数配置文件[文件路径:left4dead/cfg] host.txt 服务器LOGO地址[文件路径:left4dead/] motd.txt 服务器帮助文件[文件路径:left4dead/] Srcds启动文件参数配置 例子1:srcds.exe -game "left4dead" -insecure maxplayers …

[游戏技术]求生之路stripper:source游戏中创建模型

目录 Stirpper:Source Stirpper:Source Stirpper网址http://www.bailopan.net/stripper/版本大全 安装方法 picker 查看物品框架 ent_text 查看物品信息 ent_teleport空格数字编号(人物NPC编号为1-4)包括任意物品与自己会移动在自己准星前&#xff…

python使用RCON,连接游戏服务器求生之路2、我的世界等

简介:rcon库可以适用Source(起源引擎)、BattlEye(BE交互系统)、MINECRAFT(我的世界java1.9pre4后加入Source RCON协议)的交互 一、安装rcon库 pip3 install rcon 二、使用代码 例如&#xff0…

求生之路显示服务器列表指令,求生之路2指令大全 所有可用指令一览_游戏狗

突变模式地图指令 map 地图名 mutation1 一人对抗四个特感,会配发二等武器,被攻击到黑白画面有一次补血 map 地图名 mutation2 所有普通殭尸必须爆头才会死 map 地图名 mutation3 一开始只有99红血量及止痛药,中途没有药包可捡,会…

XUbuntu22.04之vim无法复制内容到系统(一百八十四)

简介: CSDN博客专家,专注Android/Linux系统,分享多mic语音方案、音视频、编解码等技术,与大家一起成长! 优质专栏:Audio工程师进阶系列【原创干货持续更新中……】🚀 人生格言: 人生…

C#开发的OpenRA游戏之维修按钮

C#开发的OpenRA游戏之维修按钮 前面分析物品的变卖按钮,如果理解这个流程,再看其它按钮的流程,其实是一样的,所以前面的文章是关键,只有理解通透的基础之上,才能继续往下。 维修按钮的存在价值,就是当建筑物受到敌方破坏,还没有完全倒掉之前,可以使用金币来进行修理。…

c语言双截龙_双截龙招式表

比利 BILLY : ( PS :所有人的投技都是近身 ← /→K / L / O ) 空截 空中近身 ← /→K / L / O( 就是空中摔人) 双袭牙 ↓→ 攻击键(任何一个攻击键,下同。) 裂空破 →↓ ↘ 攻 击键(相当于 “→↓→ 攻击键 ” ,要按的稍微快一点…