【新版上线】DTK-25.04.2版本正式发布
2025-11-07 16:49:57
【新版上线】DTK-25.04.2版本正式发布
大家好,DTK-25.04.2版本正式发布啦!本次更新进行了BW标卡适配,增加对多个国产操作系统适配,数学库涉及推理场景性能优化,针对BW标卡通用性优化适配,通讯库升级RCCL 2.22.3版本,编译器集成LLVM17版本,Fortran编译器新增OpenACC高级特性支持。
具体更新内容参考Release Note,下载地址: https://download.sourcefind.cn:65024/1/main/DTK-25.04.2 ,推荐大家升级到DTK-25.04.2版本。

主要更新如下:
1、增加对Kylin、SugonOS、OpenCloudOS 、Tlinux等操作系统适配,完善运行时系统多流捕获特性。
2、数学库涉及BLAS库推理场景性能优化,FP32/FP64复数精度GEMM通用性优化,针对BW标卡通用性优化适配。MIOpen库增加BW平台BN的通用性分析。BLASLt库新增HSS/BSS 融合 Gradient 计算算子,Channelwise、Tensorwise算子与框架功能。
3、通讯库升级RCCL 2.22.3版本,提供拓扑生成等功能。
4、Fortran编译器新增OpenACC线程级私有显存、设备端变量初始化、多维网格、异步等功能,提升Flang编译速度和执行性能。
5、hipprof对OpenCL API进行跟踪分析支持,以及Open MPI环境 Fortran版本支持。
评论


