Skip to content
GitLab
Menu
Projects
Groups
Snippets
Loading...
Help
Help
Support
Community forum
Keyboard shortcuts
?
Submit feedback
Contribute to GitLab
Sign in / Register
Toggle navigation
Menu
Open sidebar
OpenDAS
Torchaudio
Commits
eb72a4dd
Commit
eb72a4dd
authored
May 30, 2025
by
zhanggezhong
Browse files
Update README.md
parent
0c7e3676
Changes
1
Hide whitespace changes
Inline
Side-by-side
Showing
1 changed file
with
43 additions
and
65 deletions
+43
-65
README.md
README.md
+43
-65
No files found.
README.md
View file @
eb72a4dd
# <div align="center"><strong>TorchAudio</strong></div>
# <div align="center"><strong>TorchAudio</strong></div>
## 简介
## 简介
torchaudio 的目标是将 PyTorch 应用于音频领域。通过支持 PyTorch,torchaudio 遵循了相同的理念,即提供强大的 DCU 加速,注重通过 autograd 系统实现可训练的特性,并保持一致的风格(张量命名和维度命名)。因此,它主要是一个机器学习库,而不是一个通用的信号处理库。PyTorch 的优势在 torchaudio 中得以体现,所有计算都通过 PyTorch 操作完成,这使得它易于使用,并且像 PyTorch 的自然扩展。
torchaudio 的目标是将 PyTorch 应用于音频领域。通过支持 PyTorch,torchaudio 遵循了相同的理念,即提供强大的 DCU 加速,注重通过 autograd 系统实现可训练的特性,并保持一致的风格(张量命名和维度命名)。因此,它主要是一个机器学习库,而不是一个通用的信号处理库。PyTorch 的优势在 torchaudio 中得以体现,所有计算都通过 PyTorch 操作完成,这使得它易于使用,并且像 PyTorch 的自然扩展。torchaudio官方github地址:
[
GitHub - pytorch/audio: Data manipulation and transformation for audio signal processing, powered by PyTorch
](
https://github.com/pytorch/audio
)
-
支持音频输入输出(加载文件,保存文件)
-
使用 SoX 将各种音频格式(如 wav、mp3、ogg、flac、opus、sphere)加载到 PyTorch 的张量中。
-
支持 Kaldi(ark/scp)格式。
-
数据加载器
-
提供常见音频数据集的数据加载器。
-
音频与语音处理功能
-
强制对齐(forced_align)。
-
常用音频变换
-
提供如频谱图、AmplitudeToDB、MelScale、MelSpectrogram、MFCC、MuLaw 编码与解码、重采样等常用的音频变换。
-
兼容性接口
-
通过 PyTorch 运行与其他库(如 Kaldi)对齐的代码,包括频谱图、fbank、MFCC 等功能。
## 安装
## 安装
组件支持组合
### 适用环境
| PyTorch版本 | fastpt版本 |audio版本 | DTK版本 | Python版本 | 推荐编译方式 |
| ----------- | ----------- | ----------- | ------------------------ | -----------------| ------------ |
-
ubuntu20.04 或 rocky8.6
| 2.5.1 | 2.1.0 |2.5.1 | >= 25.04 | 3.8、3.10、3.11 | fastpt不转码 |
| 2.4.1 | 2.0.1 |2.4.1 | >= 25.04 | 3.8、3.10、3.11 | fastpt不转码 |
| 其他 | 其他 | 其他 | 其他 | 3.8、3.10、3.11 | hip转码 |
-
Python==3.10
+
pytorch版本大于2.4.1 && dtk版本大于25.04 推荐使用fastpt不转码编译。
-
PyTorch==2.4.1 DTK=25.04
### 1、使用pip方式安装
audio whl包下载目录:
[
光和开发者社区
](
https://download.sourcefind.cn:65024/4/main
)
,选择对应的pytorch版本和python版本下载对应audio的whl包
### 使用pip方式安装
```
shell
```
shell
pip
install
torchaudio
*
# (请下载对应操作系统的torchaudio的whl包)
pip
install
torch
*
(
下载torch的whl包
)
pip
install
fastpt
*
--no-deps
(
下载fastpt的whl包
)
source
/usr/local/bin/fastpt
-E
pip
install
audio
*
(
下载的audio-fastpt的whl包
)
```
```
### 2、使用源码编译方式安装
### 源码编译安装
#### 编译环境准备
#### 编译环境准备
提供基于fastpt不转码编译:
-
拉取torchaudio代码
1.
基于光源pytorch基础镜像环境:镜像下载地址:
[
光合开发者社区
](
https://sourcefind.cn/#/image/dcu/pytorch
)
,根据pytorch、python、dtk及系统下载对应的镜像版本。
2.
基于现有python环境:安装pytorch,fastpt whl包下载目录:
[
光合开发者社区
](
https://sourcefind.cn/#/image/dcu/pytorch
)
,根据python、dtk版本,下载对应pytorch的whl包。安装命令如下:
```
shell
```
shell
git clone
-b
v2.4.1-fastpt http://developer.hpccube.com/codes/OpenDAS/torchaudio.git
pip
install
torch
*
(
下载torch的whl包
)
pip
install
fastpt
*
--no-deps
(
下载fastpt的whl包, 安装顺序,先安装torch,后安装fastpt
)
pip
install
setuptools
==
59.5.0 wheel
```
```
-
导入环境变量以及安装必要依赖库
#### 源码编译安装
安装fastpt-2.0.1版本, cmake 版本要求
3.19.0
源码编译安装要求cmake版本不要过高,推荐版本cmake
3.19.0
-
代码下载
```
shell
```
shell
source
/usr/local/bin/fastpt
-c
git clone http://developer.sourcefind.cn/codes/OpenDAS/torchaudio.git
# 根据编译需要切换分支
```
```
使用audio时执行
-
提供2种源码编译方式(进入torchaudio目录):
```
shell
source
/usr/local/bin/fastpt
-e
```
```
1. 设置不转码编译环境变量
source /usr/local/bin/fastpt -C
#### 编译
安装
2. 编译whl包并
安装
python3 setup.py -v bdist_wheel
-
执行编译命令并安装
pip install dist/audio*
```
shell
3. 源码编译安装
python3 setup.py bdist_wheel
python3 setup.py install
pip3
install
dist/torchaudio
*
```
```
#### 注意事项
+
若使用pip install下载安装过慢,可添加pypi清华源:-i https://pypi.tuna.tsinghua.edu.cn/simple/
+
ROCM_PATH为dtk的路径,默认为/opt/dtk
+
在pytorch2.5.1环境下编译需要支持c++17语法,打开setup.py文件,把文件中的 -std=c++14 修改为 -std=c++17
## 版本号查询
## 验证
-
python -c "import torchaudio; print(torchaudio.__version__)",版本号与官方版本同步,查询该软件的版本号,例如2.4.1;
```
shell
python
-c
"import torchaudio; print(torchaudio.__version__)"
```
-
版本号与官方版本同步,查询该软件的版本号,例如2.4.1;
## Known Issue
## Known Issue
-
无
-
无
## 参考资料
## 其他参考
-
[
README_ORIGIN
](
README_ORIGIN.md
)
-
[
README_ORIGIN
](
README_ORIGIN.md
)
-
[
README_zh-CN
](
README_zh-CN.md
)
-
[
G
it
H
ub
-
pytorch/audio
](
https://github.com/pytorch/audio
)
-
[
https://g
it
h
ub
.com/
pytorch/audio
](
https://github.com/pytorch/audio
)
Write
Preview
Markdown
is supported
0%
Try again
or
attach a new file
.
Attach a file
Cancel
You are about to add
0
people
to the discussion. Proceed with caution.
Finish editing this message first!
Cancel
Please
register
or
sign in
to comment