Commit 6f8b2cda authored by sangwz's avatar sangwz
Browse files

更新README.md

parent e128de40
......@@ -5,9 +5,11 @@ FastPT版本与torch版本对应关系如下,其中x为小版本号:
| | FastPT版本 | torch版本 | DTK版本 |
| - | ------------------ | --------- | ------------------ |
| 1 | 2.2.x+das.dtk2504x | v2.7.1 | dtk25042 |
| 2 | 2.1.x+das.dtk2504x | v2.5.1 | dtk25041, dtk25042 |
| 3 | 2.0.x+das.dtk2504x | v2.4.1 | dtk25041, dtk2504 |
| 1 | 2.2.x+das.dtk25042 | v2.7.1 | dtk25042 |
| 2 | 2.1.x+das.dtk25042 | v2.5.1 | dtk25042 |
| 3 | 2.1.x+das.dtk25041 | v2.5.1 | dtk25041 |
| 4 | 2.0.x+das.dtk25041 | v2.4.1 | dtk25041 |
| 5 | 2.0.x+das.dtk2504 | v2.4.1 | dtk2504 |
注:
......@@ -32,7 +34,7 @@ python -c "import fastpt;print(fastpt.__version__)"
# 3 使用
**荐使用不转码编译方式,可参考下面的表格以及3.1章节的内容。**
**荐使用不转码编译方式,可参考下面的表格以及3.1章节的内容。**
工具安装后,**首先通过指令 which fastpt 来获取 fastpt 的安装路径(下面以 /usr/local/bin/fastpt 路径进行说明)**。在构建编译或使用时,通过source /usr/local/bin/fastpt -X 进行环境设置。X为模式设置参数,具体参数说明如下:
| 使用场景 | 指令 | 示例 | 说明 |
......@@ -60,7 +62,6 @@ source /usr/local/bin/fastpt -C
source /usr/local/bin/fastpt -E
```
即可。
### 3.1.2 不转码编译示例
......@@ -169,6 +170,8 @@ __device__ __forceinline__ static void reduceAdd(float *address, float val) {
(5) 编译时遇到 `fatal error: #include_next <math.h>` 的报错,可以降低CMake版本为3.19处理。
(6) 当遇到CUDAHooksMocker重复注册的问题时,一般是环境下安装了nv环境下的whl包,卸载掉此包。
## 3.2 转码编译
FastPT提供了HCU下,转码到HIP格式,通过hipcc进行编译的方法,实现基于torch的应用中CUDA代码移植到HCU平台,工具接口包括CUDAExtension、CppExtension、hipify转码接口。编译时,转码一般是自动实现的。另外提供了自定义接口映射用来补充代码映射关系;提供了保持源码文件夹下文件相对路径的转码方法。
......
Markdown is supported
0% or .
You are about to add 0 people to the discussion. Proceed with caution.
Finish editing this message first!
Please register or to comment