首页 > 其他分享> > GPU并行环境

GPU并行环境

2021-08-12 06:31:14 作者：互联网

GPU并行环境

图1. CPU和GPU架构

CPU 由专为顺序串行处理而优化的几个核心组成。GPU则由数以千计的更小、更高效的核心组成，这些核心专为同时处理多任务而设计。

图2. 串行运算示意图

图3. 并行运算示意图

容易地理解串行运算和并行运算之间的区别。传统的串行编写软件具备以下几个特点：

要运行在一个单一的具有单一中央处理器（CPU）的计算机上；

一个问题分解成一系列离散的指令；

指令必须一个接着一个执行；

只有一条指令可以在任何时刻执行。

而并行计算则改进了很多重要细节：

要使用多个处理器运行；

一个问题可以分解成可同时解决的离散指令；

每个部分进一步细分为一系列指示；

每个部分的问题可以同时在不同处理器上执行。

提高了算法的处理速度。

GPU加速技术

CUDA

为充分利用GPU的计算能力，NVIDIA在2006年推出了CUDA（ComputeUnifiedDevice Architecture，统一计算设备架构）这一编程模型。CUDA是一种由NVIDIA推出的通用并行计算架构，该架构使GPU能够解决复杂的计算问题。包含了CUDA指令集架构（ISA）以及GPU内部的并行计算引擎。开发人员现在可以使用C语言来为CUDA架构编写程序。

通过这个技术，用户可利用NVIDIA的GeForce 8以后的GPU和较新的QuadroGPU进行计算。以GeForce 8800 GTX为例，其核心拥有128个内处理器。利用CUDA技术，就可以将那些内处理器串通起来，成为线程处理器去解决数据密集的计算。而各个内处理器能够交换、同步和共享数据。

从CUDA体系结构的组成来说，包含了三个部分：开发库、运行期环境和驱动。

开发库是基于CUDA技术所提供的应用开发库。CUDA的1.1版提供了两个标准的数学运算库：CUFFT (离散快速傅立叶变换)和CUBLAS(离散基本线性计算)的实现。这两个数学运算库所解决的是典型的大规模的并行计算问题，也是在密集数据计算中非常常见的计算类型。开发人员在开发库的基础上可以快速、方便的建立起自己的计算应用。此外，开发人员也可以在CUDA的技术基础上实现出更多的开发库。

运行期环境提供了应用开发接口和运行期组件，包括基本数据类型的定义和各类计算、类型转换、内存管理、设备访问和执行调度等函数。基于CUDA开发的程序代码在实际执行中分为两种，一种是运行在CPU上的宿主代码(HostCode)，一种是运行在GPU上的设备代码(Device Code)。

不同类型的代码由于其运行的物理位置不同，能够访问到的资源不同，因此对应的运行期组件也分为公共组件、宿主组件和设备组件三个部分，基本上囊括了所有在GPGPU开发中所需要的功能和能够使用到的资源接口，开发人员可以通过运行期环境的编程接口实现各种类型的计算。

由于目前存在着多种GPU版本的NVIDIA显卡，不同版本的GPU之间都有不同的差异，因此驱动部分基本上可以理解为是CUDA-enable的GPU的设备抽象层，提供硬件设备的抽象访问接口。CUDA提供运行期环境也是通过这一层来实现各种功能的。由于体系结构中硬件抽象层的存在，CUDA今后也有可能发展成为一个通用的GPU标准接口，兼容不同厂商的GPU产品。

图4. CUDA处理流程

对于软件开发者来说，使用Cuda平台调用Cuda的加速库使用的语言包括：C、C++和Fortran。C/C++编程者使用UDAC/C++并用nvcc进行编译。

Nvidia的LLVM库是基于C/C++编译器的。Fortran的开发者能够使用CUDA Fortran，编译使用PGI CUDA Fortran。当然CUDA平台也支持其他的编程接口，包括OpenCL，微软的DirectCompute、OpenGL ComputeShaders和 C++ AMP。第三方的开发者也可以使用Python、Perl、Fortran、Java、Ruby、Lua、Haskell、R、MATLAB、IDL由曼赛马提亚原生支持。

OpenCL

OpenCL全称Open Computing Language即开放计算语言。OpenCL为异构平台提供了一个编写程序，尤其是并行程序的开放的框架标准。OpenCL所支持的异构平台可由多核CPU、GPU或其他类型的处理器组成。

CUDA只能够在NVIDIA的GPU硬件上运行。但是，OpenCL的目标是面向任何一种并行处理器，OpenCL是第一种真正的开放自由版权编程标准，适用于异构系统上的通用计算。而异构平台可由CPU、GPU、DSP、FPGA或其他类型的处理器搭建。

OpenCL程序同CUDA程序一样，也是分为两部分，一是用于编写内核程序(在OpenCL设备上运行的代码) 的语言，二是定义并控制平台的API。OpenCL提供了基于任务和基于数据两种并行计算机制，极大地扩展了GPU 的应用范围，使之不再局限于图形领域。

OpenCL由Khronos Group维护。Khronos Group是一个非盈利性技术组织，维护着多个开放的工业标准，例如OpenGL和OpenAL。这两个标准分别用于三维图形和计算机音频方面。OpenCL源程序既可以在多核CPU上也可以在GPU上编译执行，这大大提高了代码的性能和可移植性。OpenCL标准由相应的标准委员会制订，委员会的成员来自业界各个重要厂商。作为用户和程序员期待已久的东西，OpenCL带来两个重要变化：一个跨厂商的非专有软件解决方案；一个跨平台的异构框架以同时发挥系统中所有计算单元的能力。

OpenCL是一个用于异构平台上编程的开放性行业标准。这个平台可以包括 CPU GPU和其他各类计算设备，OpenCL会将各类计算设备组织成一个统一的平台。OpenCL不仅仅是一种编程语言，更是一个完整的并行编程框架，包括编程语言，API，函数库以及运行时系统来支持软件在整个平台上的开发。

参考链接：

https://www.eet-china.com/mp/a67644.html

标签：并行,OpenCL,环境,CUDA,计算,GPU,CPU,处理器
来源： https://www.cnblogs.com/wujianming-110117/p/15130979.html