六月总结&七月计划
作者:互联网
六月总结
1. 主要任务
- onnxruntime推理库学习
目标: API接口学习+log模块学习+总结
进展: 未完成,大概看了接口那块的内容,整体onnxrutime的框架比较复杂,未能掌握。目前我对后端引擎的框架和接口设计掌握的太少了,这块找相关资料又很少,只能从相关库的学习中去自己总结,累。
总结: 无
反思: 这个月的工作太杂乱了,查好多无意义的bug,还有适配高版本的gcc出现的一些莫名其妙的问题,对gcc编译相关的知识点是多了一些了解,升级gcc最主要的一点就是C++的stl里面对链表list和字符串string编译,gcc5.1以上会多一个__cxx11的前缀域,在编译选项中加入-_D_GLBCXX_USE_CXX!!_ABI=0就可以不是用这种加前缀的方式编译函数签名,不然会出现连接找不到定义式或者运行时含有string类型的变量莫名其妙无法访问的问题。
PS: 这块内容只能抽空学了,结合公司的内部版本一起学习,按计划延期,能学多少算多少。目前掌握的太少,也就没啥总结的了23333. - 一门CUDA编程基础书籍——《NVIDIA_CUDA_Programming_Guide》
进展: 看完了,这个文档是按照nVidia官方文档翻译来的,语言组织说实在的很垃圾,不通顺。
总结: 整体上这个文档包括两部分,第一部分主要讲cuda相关的软硬件基础,第二部分是附录,本以为前面的第一部分会是主体,但看完后发现,附录部分对cudaruntime接口和cuda驱动接口的介绍更加实用。而且对比来看,cuda驱动的接口和cudaruntime的接口大部分都是一一对应的,cuda runtime的接口在调用时可以不去显式初始化上下文什么的,相对而言可以让我们的编程更加侧重于对并行算法的思考和设计,更加实用。而cuda runtime接口这部分,所有的函数接口都和对应的硬件实现密切相关,分为两大部分,一部分是内存操作,包括全局内存、共享内存、局部内存等的分配释放和copy,如何最大化利用gpu的不同内存的带宽来提高计算效率;另一部分是核函数设计,如何利用gpu的MDMT特性实现高度并行的计算任务。关于这部分内容,七月份继续安排一本《CUDA编程基础与实践》的书来阅读+同步练习。
2. 其他任务
- 看形势,看行情,学无止境,又不像做饭,不能等到啥原料都准备好再下锅。
国内就业大环境不好,government承诺的补贴也不发了,普调也没消息,最近也有身边的同事跑路了,怪自己没有早点准备力扣,真就“无跳槽不涨薪”。
3. 月度小结
七月计划
1. 主要任务
- 《CUDA编程-基础与实践》
目标: 看完+同步coding练习
Deadline: 2022.7.20 - 力扣简单题60道
目标: 力扣找简单题60道刷完,平均每天两道,这个月只安排简单题,应该能刷完。找找感觉,熟悉算法面试相关知识点
Deadline: 2022.7.30
2. 其他任务
- 无其他任务,七月份工作上还是集中在SDK效率优化上,不想加太多计划了,天天加班都快神经衰弱了。
标签:总结,七月,编程,内存,六月,接口,CUDA,cuda 来源: https://www.cnblogs.com/lee-zq/p/16437674.html