网迅新闻

北京网迅科技有限公司

高端芯片设计

nvidia针对异质超级运算推出最新版编译器

nvidia (辉达) 今天宣布推出 17.7 版 pgi 2017 编译器与工具,协助高效能运算系统开发者针对搭载多核 cpu 与异质化 gpu 加速器的系统,开发出效能更高的软体,同时大幅简化程式设计流程。

  即日释出的 pgi 17.7 编译器与工具的关键特点包括:

   支援tesla v100 gpu: pgi openacc 与cuda fortran现已支援新款nvidia volta gv100 gpu,提供更多记忆体频宽、串流多重处理器、新一代nvidia nvlink以及全新微架构功能,堆砌出更好的效能与可编程功能。

   openacc支援cuda整合记忆体:pgi 17.7 版编译器能利用 cuda 整合记忆体,简化针对 gpu 加速系统程式的编译流程。藉由开启简易编译器选项,openacc 即可在 cuda 整合记忆体中配置资料的存放位置,而不需撰写资料移动程式码或指令。

   支援多核 cpu 的 openmp 4.5 :初始针对 openmp 4.5 语法与功能的支援,即可针对大多数运行于多核cpu系统中的 openmp 4.5 平行处理进行编程。程式中的目标区块(target)在预设支援条件设定后,会将多核系统当成目标,而parallel 以及distribute等程式迴圈则能分散到所有openmp执行绪进行平行处理。

   对fortran语法的衍生类别进行深层复製: 透过 openacc 指令能在cpu主控端与gpu元件记忆体之间搬移匯整或深层巢状fortran资料物件,包括指标型物件的巡行与管理作业。

   c 语言方面的改良:pgi 17.7 c 编译器内含许多逐次扩增的 c 17 功能,并将其汇整到 cuda 9.0 nvcc 主编译器的支援範围内。在 lcals 迴圈处理性能量测指标中效能平均提升了20%。

   在 openacc 程式区段中使用 c 14 lambdas 函数:c 语言的lambdas函数,能在匿名函式物件被唿叫或是以参数形态被传递时,提供一种便利的方法来定义其物件。从 pgi 17.7 版开始,c 语言撰写程式的 openacc 运算区段都支援 lambdas 函数,包括针对不同编程模型或平台生成对应的程式码。 c 14 则引进更多lambdas函数用法,尤其是多类型的 lambdas函数。上述这些功能都可运用在 openacc 程式中。

   与cusolver 函式库互通:透过使用 pgi 提供的介面模组与 pgi 17.7 内建的 pgi 版 cusolver 函式库,即可唿叫包括 cuda fortran、openacc fortran、c 以及 c 等语言的最佳化 cusolverdn 函式。

   支援 nvidia tesla gpu与多核 cpu 处理的 pgi unified binary:使用 openacc 编译出的程式不仅支援 gpu 加速,还能在多核cpu上支援平行处理。在搭载gpu的系统上运行时, openacc 支援区段分载以及在gpu上执行程式。当在没有安装gpu的系统上运行时,openacc 的程式区段能分散到系统中所有cpu核心上同步处理。

   全新分析功能支援 cuda 整合记忆体与openacc :pgi 17.7 profiler现已加入多项全新 openacc 分析功能,包括支援有连结 gpu 与无连结 gpu 的两种多核 cpu 平台,另外还新增全新的摘要(summary)检视功能,能显示处理每种 openacc 程式码结构所耗费的执行时间。新增的 cuda 统合记忆体功能,能追踪出每项 cpu 分页错误对应到哪些程式码,以及这些程式码所涉及的资料所在位置,并支援全新 cuda 整合记忆体分页频繁的置换、节流、远端对应事件、nvlink以及其他诸多功能。

  pgi 17.7的其他功能与改良包括所有支援全方位平台环境模组、预製热门开源函式库与程式,以及新推出的《运用 openacc 执行平行运算》的教学系列影片 。


分享:
上一篇用途广泛的mcu芯片有哪些原厂? 返回列表 下一篇西部数据突破技术限制 推出高容量microsd存储卡
网站地图