其他分享
首页 > 其他分享> > kernel组培训概要

kernel组培训概要

作者:互联网

入职培训概要

1、熟悉kernel编译流程。

以矩阵乘法kernel为例子。

2、熟悉opencl/pyopencl异构编程接口。

简单Kernel代码:

熟悉芯片编程架构/cache结构/systolic array
相关资料:

    confluence/Technology Documents/CSR_CORE hardware description

confluence/Technology Documents/Systolic array hardware description and API use guide.

熟悉testing和tuning流程。
示例代码(简单):pint_sdk/test/kernels/dnn/tensor_ops/tune_average_pool_2D_f32.py
示例代码:pint_sdk/test/kernels/blas/level3/tune_gemm_f32.py
tuner python库:pint_sdk/test/kernel_tuner/

  1. Miniconda环境安装

安装文件位置:/home/swshare/yzeng/Miniconda3***.sh。

conda安装完成之后,启动conda,继续使用pip安装pyopencl/scipy/pandas

标签:kernel,培训,概要,kernels,py,test,sdk,pint
来源: https://blog.csdn.net/ReCclay/article/details/114019955