README.md 1.96 KB
Newer Older
liangjing's avatar
liangjing committed
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
# ResNet50(Residual Network with 50-layer)

## 模型介绍

ResNet50是一种用于图像识别的深度神经网络模型。

## 模型结构

ResNet50网络模型由一系列卷积层、池化层、全局平均池化层和全连接层组成。该模型的特殊之处在于它包含多个残差块,每个残差块由多个卷积层和跳跃连接组成。

在ResNet50中,输入图像通过一系列卷积层和池化层进行特征提取,然后通过多个残差块进行深度特征学习。每个残差块包含多个卷积层和跳跃连接,跳跃连接允许信息在残差块内和残差块之间的传递,从而解决了深度神经网络中出现的梯度消失问题。最后,全局平均池化层将特征映射到一个固定长度的向量,该向量再通过全连接层进行分类或回归等任务。

## 数据集

需使用ImageNET数据集,下载地址:http://image-net.org/challenges/LSVRC/2012/2012-downloads (require an account)

具体处理方式可详见:https://github.com/mlcommons/training/tree/master/image_classification

## 训练

### 环境配置

提供[光源](https://www.sourcefind.cn/#/service-details)拉取的训练的docker镜像:

* 训练镜像:

python依赖安装:

    pip install -r requirement.txt

### 训练

训练命令:

    bash 8dcu_multi.sh >& output.log &

### 预训练模型

在本目录下我们提供了一个预训练模型如下:

    mlperf_resnet50
    ├── checkpoint
    ├── ckpt-0.data-00000-of-00001
    ├── ckpt-0.index
    ├── ckpt-500.data-00000-of-00001
    ├── ckpt-500.index

## 性能和准确率数据

数据采用ImageNet Data,使用的加速卡是DCU Z100L,采用单机8卡规模测试结果如下

| 测试平台 | Accuacy(%) | Speed(s) |
| :------: | :--------: | :------: |
|  Z100L   |    75.9    |   xxx    |

## 历史版本

* https://developer.hpccube.com/codes/modelzoo/mlperf_resnet50

## 参考

* https://mlcommons.org/en/
* https://github.com/mlcommons