Skip to content
GitLab
Menu
Projects
Groups
Snippets
Loading...
Help
Help
Support
Community forum
Keyboard shortcuts
?
Submit feedback
Contribute to GitLab
Sign in / Register
Toggle navigation
Menu
Open sidebar
OpenDAS
fastpt
Commits
6f8b2cda
Commit
6f8b2cda
authored
Nov 07, 2025
by
sangwz
Browse files
更新README.md
parent
e128de40
Changes
1
Hide whitespace changes
Inline
Side-by-side
Showing
1 changed file
with
8 additions
and
5 deletions
+8
-5
README.md
README.md
+8
-5
No files found.
README.md
View file @
6f8b2cda
...
@@ -5,9 +5,11 @@ FastPT版本与torch版本对应关系如下,其中x为小版本号:
...
@@ -5,9 +5,11 @@ FastPT版本与torch版本对应关系如下,其中x为小版本号:
| | FastPT版本 | torch版本 | DTK版本 |
| | FastPT版本 | torch版本 | DTK版本 |
| - | ------------------ | --------- | ------------------ |
| - | ------------------ | --------- | ------------------ |
| 1 | 2.2.x+das.dtk2504x | v2.7.1 | dtk25042 |
| 1 | 2.2.x+das.dtk25042 | v2.7.1 | dtk25042 |
| 2 | 2.1.x+das.dtk2504x | v2.5.1 | dtk25041, dtk25042 |
| 2 | 2.1.x+das.dtk25042 | v2.5.1 | dtk25042 |
| 3 | 2.0.x+das.dtk2504x | v2.4.1 | dtk25041, dtk2504 |
| 3 | 2.1.x+das.dtk25041 | v2.5.1 | dtk25041 |
| 4 | 2.0.x+das.dtk25041 | v2.4.1 | dtk25041 |
| 5 | 2.0.x+das.dtk2504 | v2.4.1 | dtk2504 |
注:
注:
...
@@ -32,7 +34,7 @@ python -c "import fastpt;print(fastpt.__version__)"
...
@@ -32,7 +34,7 @@ python -c "import fastpt;print(fastpt.__version__)"
# 3 使用
# 3 使用
**荐使用不转码编译方式,可参考下面的表格以及3.1章节的内容。**
**
推
荐使用不转码编译方式,可参考下面的表格以及3.1章节的内容。**
工具安装后,
**首先通过指令 which fastpt 来获取 fastpt 的安装路径(下面以 /usr/local/bin/fastpt 路径进行说明)**
。在构建编译或使用时,通过source /usr/local/bin/fastpt -X 进行环境设置。X为模式设置参数,具体参数说明如下:
工具安装后,
**首先通过指令 which fastpt 来获取 fastpt 的安装路径(下面以 /usr/local/bin/fastpt 路径进行说明)**
。在构建编译或使用时,通过source /usr/local/bin/fastpt -X 进行环境设置。X为模式设置参数,具体参数说明如下:
| 使用场景 | 指令 | 示例 | 说明 |
| 使用场景 | 指令 | 示例 | 说明 |
...
@@ -60,7 +62,6 @@ source /usr/local/bin/fastpt -C
...
@@ -60,7 +62,6 @@ source /usr/local/bin/fastpt -C
source /usr/local/bin/fastpt -E
source /usr/local/bin/fastpt -E
```
```
即可。
### 3.1.2 不转码编译示例
### 3.1.2 不转码编译示例
...
@@ -169,6 +170,8 @@ __device__ __forceinline__ static void reduceAdd(float *address, float val) {
...
@@ -169,6 +170,8 @@ __device__ __forceinline__ static void reduceAdd(float *address, float val) {
(5) 编译时遇到
`fatal error: #include_next <math.h>`
的报错,可以降低CMake版本为3.19处理。
(5) 编译时遇到
`fatal error: #include_next <math.h>`
的报错,可以降低CMake版本为3.19处理。
(6) 当遇到CUDAHooksMocker重复注册的问题时,一般是环境下安装了nv环境下的whl包,卸载掉此包。
## 3.2 转码编译
## 3.2 转码编译
FastPT提供了HCU下,转码到HIP格式,通过hipcc进行编译的方法,实现基于torch的应用中CUDA代码移植到HCU平台,工具接口包括CUDAExtension、CppExtension、hipify转码接口。编译时,转码一般是自动实现的。另外提供了自定义接口映射用来补充代码映射关系;提供了保持源码文件夹下文件相对路径的转码方法。
FastPT提供了HCU下,转码到HIP格式,通过hipcc进行编译的方法,实现基于torch的应用中CUDA代码移植到HCU平台,工具接口包括CUDAExtension、CppExtension、hipify转码接口。编译时,转码一般是自动实现的。另外提供了自定义接口映射用来补充代码映射关系;提供了保持源码文件夹下文件相对路径的转码方法。
...
...
Write
Preview
Markdown
is supported
0%
Try again
or
attach a new file
.
Attach a file
Cancel
You are about to add
0
people
to the discussion. Proceed with caution.
Finish editing this message first!
Cancel
Please
register
or
sign in
to comment