当前位置: 首页 > news >正文

免费详情页模板网站不花钱网站推广

免费详情页模板网站,不花钱网站推广,国外网站怎么做威客,兰州关键词优化排名背景: 项目中有个数据量大小为5195 * 512 * 128float 1.268G的显存,发现有个函数调用很耗时,函数里面就是对这个显存进行128个元素求和,得到一个5195 * 512的图像 分析 1. 为什么耗时 直观上感觉这个流程应该不怎么耗时才对&a…

背景:

        项目中有个数据量大小为5195 * 512 * 128float = 1.268G的显存,发现有个函数调用很耗时,函数里面就是对这个显存进行128个元素求和,得到一个5195 * 512的图像

分析

1. 为什么耗时

直观上感觉这个流程应该不怎么耗时才对,但是写了个demo测试发现

上面代码,统计耗时

需要消耗掉50ms左右(显卡是Quadro P2200)

太恐怖了

2.修改数据类型为int16_t

将数据类型修改为int16_t访问的显存大小降为0.6G左右

降低为上面结果

3.修改数据类型为int8_t

将数据类型修改为int8_t访问的显存大小降为0.3G左右

降低不再明显

3. 修改访问方式

由于显存是按照内存事务一次性加载的,如果按照上面代码进行访问,按照个人理解,32个线程一次加载的内存是不够用的,需要至少32次内存事务才能完成处理,尝试修改代码:

同样是int类型,耗时如下:

结论:

        当cuda程序需要访问的显存过大时,将会出现耗时非常严重的问题

参考链接:

cuda 学习之内存层次结构_请说明 register,shared,global 以及 constant 四类 cuda 内 存_xukang95的博客-CSDN博客

http://www.zhongyajixie.com/news/3556.html

相关文章:

  • 大连网站建设 领超最好推广app赚佣金平台
  • 深圳网站建设找哪家好seo文章代写一篇多少钱
  • 中英文网站建设价格李江seo
  • 贵阳手机银行app关键词的优化和推广
  • 新网站如何做网站优化江门关键词排名优化
  • 餐饮网站建设推广长春百度seo排名
  • 有网站建设费科目吗中文搜索引擎排行榜
  • ps做网站一般用多大字体淘宝流量网站
  • 做网站的钱付款用途写什么智能营销系统
  • 佛山网站建设计百度下载链接
  • 做本地网站网络推广主要工作内容
  • 大连金州网站建设南宁白帽seo技术
  • 电商网站 支付安装百度
  • 深圳布吉做网站百度推广一般要多少钱
  • 陕西省建设厅网站安全员报名排名函数rank怎么用
  • 怎样做网站反链网络营销专业介绍
  • 好看的网站首页特效西安网络公司
  • 吴江区建设用地申报网站教育机构排名
  • 怎样免费建企业网站吗关键词竞价排名是什么意思
  • php网站开发文本格式设置最新战争新闻事件今天
  • 网站导航栏seo优化推广工程师
  • 网站中下滑菜单怎么做seo是什么缩写
  • 贵州省住房与城乡建设部网站搜索引擎推广
  • 做网站龙岗夸克搜索入口
  • WordPress博客使用教程seo建站平台哪家好
  • 黄冈做网站公司郑州seo排名优化公司
  • 网站建设众筹女教师网课入侵录屏冫
  • 无锡网站建设无锡网络推广苏州排名搜索优化
  • 关于域名用于非网站用途的承诺书什么平台免费推广效果最好
  • 网站安装教程吉林黄页电话查询