Commit c200fbac authored by Sugon_ldc's avatar Sugon_ldc
Browse files

modeify readme and add some pictures

parent 311ba6e2
......@@ -43,6 +43,12 @@ mmcv-full:1.6.1+gitdebbc80.dtk2210
```
`Tips:以上dtk驱动、python、pytorch、mmcv等DCU相关工具版本需要严格一一对应`
之后还需要对部分版本进行限制
```
pip3 install yapf==0.32.0
```
## 数据集
`something v2`
......@@ -71,7 +77,7 @@ cat 20bn-something-something-v2-?? | tar zx
解压完成后使用如下命令抽取RGB帧
```
cd ./tsm_pytorch/tools/data/sthv2/
cd /workspace/tools/data/sthv2/
bash extract_rgb_frames_opencv.sh
```
......@@ -117,7 +123,6 @@ bash generate_rawframes_filelist.sh
└── videos
```
## 训练
一般情况下,ModelZoo上的项目提供单机训练的启动方法即可,单机多卡、单机单卡至少提供其一训练方法。
### 单机多卡
```
bash train.sh
......@@ -133,8 +138,15 @@ bash train_single.sh
测试的日志会以tsm_dcu_date.log的形式保存在工程的根目录中
<figure>
<img src="result_1.png" width=500/>
<img src="result_2.png" width=500/>
<img src="result_3.png" width=500/>
<img src="result_4.png" width=500/>
</figure>
### 精度
测试数据:something v2,使用的加速卡:Z100L。
根据测试结果情况填写表格:
......@@ -143,7 +155,7 @@ bash train_single.sh
| 4 | 59.14% |
## 应用场景
### 算法类别
`视频分析,动作识别`
`动作识别`
### 热点应用行业
`交通,政府,家居`
......
......@@ -5,6 +5,6 @@ modelName=tsm_pytorch
# 模型描述
modelDescription=TSM模型是一种基于时序建模的深度学习算法,利用时间偏移增强视频帧序列的表示能力,用于提高视频动作识别的准确性和鲁棒性。
# 应用场景
appScenario=训练,交通,政府,家居
appScenario=训练,动作识别,交通,政府,家居
# 框架类型
frameType=pytorch
Markdown is supported
0% or .
You are about to add 0 people to the discussion. Proceed with caution.
Finish editing this message first!
Please register or to comment