DTK 26.04 新特性

新平台适配

驱动、HIP运行时全面适配深算三号BW1100系列DCU

了解更多>

运行时功能升级

新增DCU定制化功能API,单边低延迟通讯库,TensorCore接口

了解更多>

基础数学库原生支持FP8精度

深算三号BW1100系列基础数学库定制优化,BLAS库、卷积算子库性能深度优化

了解更多>
DTK 软件栈

异构计算语言

  • 显式并行语言
  • HIP
  • CUDA
  • 通用并行语言
  • OpenCL
  • One API
  • 隐式并行语言
  • OpenACC
  • OpenMP
  • 计算服务层

  • Blas库
  • CNN库
  • Thrust
  • Lapack库
  • SPARSE库
  • CUB库
  • 计算工具层

  • 优化器
  • 调试器
  • 监控器
  • 计算执行层

  • 运行时系统
  • CUDA兼容层
  • 通讯库
  • 基础计算层

  • 国产操作系统
  • 虚拟化
  • 容器
  • 高速互联网络
  • 硬件计算资源
    DCU加速器
    教程

    DTK 开发人员教程是一系列教程视频,旨在帮助您开始使用 DTK进 行 DCU开发。它探讨了 DCU性能分析、调试和优化的关键功能。

    使用DTK在DCU上编程开发

    DCU异构编程 DCU并行模型

    点击查看

    借助DTK分析和调试应用程序

    DCU性能分析 DCU调试工具

    点击查看

    CUDA应用移植技巧

    GPUfusion工具简介 CUDA程序移植流程

    点击查看

    使用数学库加速计算

    数学库分类 数学库使用简介

    点击查看
    DTK最新消息

    【视频课程】DTK_CUDA兼容

    点击查看

    【DTK答疑区】数学库、运行时、编译器

    点击查看

    MIOPEN库对AI模型中dynamic shape的优化

    点击查看

    运行时系统对不同场景应用的优化

    点击查看