nvidia针对异质超级运算推出最新版编译器 -尊龙凯时官方网站

网迅新闻

北京网迅科技有限公司

高端芯片设计

nvidia针对异质超级运算推出最新版编译器

时间：2017-10-14 09:57:44　　来源：网迅科技尊龙凯时官方网站官网　　点击数：122

nvidia (辉达) 今天宣布推出 17.7 版 pgi 2017 编译器与工具，协助高效能运算系统开发者针对搭载多核 cpu 与异质化 gpu 加速器的系统，开发出效能更高的软体，同时大幅简化程式设计流程。

即日释出的 pgi 17.7 编译器与工具的关键特点包括：

支援tesla v100 gpu： pgi openacc 与cuda fortran现已支援新款nvidia volta gv100 gpu，提供更多记忆体频宽、串流多重处理器、新一代nvidia nvlink以及全新微架构功能，堆砌出更好的效能与可编程功能。

openacc支援cuda整合记忆体：pgi 17.7 版编译器能利用 cuda 整合记忆体，简化针对 gpu 加速系统程式的编译流程。藉由开启简易编译器选项，openacc 即可在 cuda 整合记忆体中配置资料的存放位置，而不需撰写资料移动程式码或指令。

支援多核 cpu 的 openmp 4.5 ：初始针对 openmp 4.5 语法与功能的支援，即可针对大多数运行于多核cpu系统中的 openmp 4.5 平行处理进行编程。程式中的目标区块(target)在预设支援条件设定后，会将多核系统当成目标，而parallel 以及distribute等程式迴圈则能分散到所有openmp执行绪进行平行处理。

对fortran语法的衍生类别进行深层复製：透过 openacc 指令能在cpu主控端与gpu元件记忆体之间搬移匯整或深层巢状fortran资料物件，包括指标型物件的巡行与管理作业。

c 语言方面的改良：pgi 17.7 c 编译器内含许多逐次扩增的 c 17 功能，并将其汇整到 cuda 9.0 nvcc 主编译器的支援範围内。在 lcals 迴圈处理性能量测指标中效能平均提升了20%。

在 openacc 程式区段中使用 c 14 lambdas 函数：c 语言的lambdas函数，能在匿名函式物件被唿叫或是以参数形态被传递时，提供一种便利的方法来定义其物件。从 pgi 17.7 版开始，c 语言撰写程式的 openacc 运算区段都支援 lambdas 函数，包括针对不同编程模型或平台生成对应的程式码。 c 14 则引进更多lambdas函数用法，尤其是多类型的 lambdas函数。上述这些功能都可运用在 openacc 程式中。

与cusolver 函式库互通：透过使用 pgi 提供的介面模组与 pgi 17.7 内建的 pgi 版 cusolver 函式库，即可唿叫包括 cuda fortran、openacc fortran、c 以及 c 等语言的最佳化 cusolverdn 函式。

支援 nvidia tesla gpu与多核 cpu 处理的 pgi unified binary：使用 openacc 编译出的程式不仅支援 gpu 加速，还能在多核cpu上支援平行处理。在搭载gpu的系统上运行时， openacc 支援区段分载以及在gpu上执行程式。当在没有安装gpu的系统上运行时，openacc 的程式区段能分散到系统中所有cpu核心上同步处理。

全新分析功能支援 cuda 整合记忆体与openacc ：pgi 17.7 profiler现已加入多项全新 openacc 分析功能，包括支援有连结 gpu 与无连结 gpu 的两种多核 cpu 平台，另外还新增全新的摘要(summary)检视功能，能显示处理每种 openacc 程式码结构所耗费的执行时间。新增的 cuda 统合记忆体功能，能追踪出每项 cpu 分页错误对应到哪些程式码，以及这些程式码所涉及的资料所在位置，并支援全新 cuda 整合记忆体分页频繁的置换、节流、远端对应事件、nvlink以及其他诸多功能。

pgi 17.7的其他功能与改良包括所有支援全方位平台环境模组、预製热门开源函式库与程式，以及新推出的《运用 openacc 执行平行运算》的教学系列影片。

上一篇用途广泛的mcu芯片有哪些原厂？返回列表 下一篇西部数据突破技术限制推出高容量microsd存储卡