DTK 25.04.2 新特性

新平台适配

驱动、HIP运行时全面适配深算三号PCIe标卡

了解更多>

编译器优化

DCC编译器升级与性能优化、Fortran OpenACC编译速度及执行性能提升

了解更多>

基础数学库性能优化

深算三号标卡基础数学库定制优化,BLAS库、卷积算子库性能深度优化

了解更多>
DTK 软件栈

异构计算语言

  • 显式并行语言
  • HIP
  • CUDA
  • 通用并行语言
  • OpenCL
  • One API
  • 隐式并行语言
  • OpenACC
  • OpenMP
  • 计算服务层

  • Blas库
  • CNN库
  • Thrust
  • Lapack库
  • SPARSE库
  • CUB库
  • 计算工具层

  • 优化器
  • 调试器
  • 监控器
  • 计算执行层

  • 运行时系统
  • CUDA兼容层
  • 通讯库
  • 基础计算层

  • 国产操作系统
  • 虚拟化
  • 容器
  • 高速互联网络
  • 硬件计算资源
    DCU加速器
    教程

    DTK 开发人员教程是一系列教程视频,旨在帮助您开始使用 DTK进 行 DCU开发。它探讨了 DCU性能分析、调试和优化的关键功能。

    使用DTK在DCU上编程开发

    DCU异构编程 DCU并行模型

    点击查看

    借助DTK分析和调试应用程序

    DCU性能分析 DCU调试工具

    点击查看

    CUDA应用移植技巧

    GPUfusion工具简介 CUDA程序移植流程

    点击查看

    使用数学库加速计算

    数学库分类 数学库使用简介

    点击查看
    DTK最新消息

    【视频课程】DTK_CUDA兼容

    点击查看

    【DTK答疑区】数学库、运行时、编译器

    点击查看

    MIOPEN库对AI模型中dynamic shape的优化

    点击查看

    运行时系统对不同场景应用的优化

    点击查看