# MobileNetv4
轻量化之王MobileNetV4,手机推理速度3.8ms,在移动CPU、DSP、GPU以及苹果M处理器和谷歌Pixel Edge TPU全都高性能。
## 论文
`MobileNetV4 - Universal Models for the Mobile Ecosystem`
- https://arxiv.org/pdf/2404.10518
## 模型结构
通用UIB块在倒瓶颈块中引入两个可选的DW,一个在扩展层之前,另一个在扩展层和投影层之间,很好地统一了几个重要现有块,包括原始的IB块、ConvNext块以及ViT中的FFN块。此外,UIB还引入了一种新的变体:额外的深度卷积IB(ExtraDW)块;MobileMQA一个专为加速器优化的新型注意力块,它能提供超过39%的推理速度提升。
## 算法原理
利用标准组件引入新的通用反转瓶颈UIB和移动MQA层,并结合改进的神经架构搜索(NAS)方法改进mobilenet,然后将这些与一种新颖的、最先进的蒸馏方法相结合。
## 环境配置
```
mv mobilenetv4_pytorch MobileNetv4 # 去框架名后缀
```
### Docker(方法一)
```
docker pull image.sourcefind.cn:5000/dcu/admin/base/pytorch:2.1.0-centos7.6-dtk24.04-py310
# 为以上拉取的docker的镜像ID替换,本镜像为:c85ed27005f2
docker run -it --shm-size=32G -v $PWD/MobileNetv4:/home/MobileNetv4 -v /opt/hyhal:/opt/hyhal:ro --privileged=true --device=/dev/kfd --device=/dev/dri/ --group-add video --name mobilenetv4 bash
cd /home/MobileNetv4
pip install -r requirements.txt # requirements.txt
```
### Dockerfile(方法二)
```
cd MobileNetv4/docker
docker build --no-cache -t mobilenetv4:latest .
docker run --shm-size=32G --name mobilenetv4 -v /opt/hyhal:/opt/hyhal:ro --privileged=true --device=/dev/kfd --device=/dev/dri/ --group-add video -v $PWD/../../MobileNetv4:/home/MobileNetv4 -it mobilenetv4 bash
# 若遇到Dockerfile启动的方式安装环境需要长时间等待,可注释掉里面的pip安装,启动容器后再安装python库:pip install -r requirements.txt。
```
### Anaconda(方法三)
1、关于本项目DCU显卡所需的特殊深度学习库可从光合开发者社区下载安装:
- https://developer.sourcefind.cn/tool/
```
DTK驱动:dtk24.04
python:python3.10
torch:2.1.0
torchvision:0.16.0
```
`Tips:以上dtk驱动、python、torch等DCU相关工具版本需要严格一一对应。`
2、其它非特殊库参照requirements.txt安装
```
pip install -r requirements.txt # requirements.txt
```
## 数据集
源论文采用[ImageNet-2012](https://image-net.org/challenges/LSVRC/index.php)训练,本步骤说明采用数据集`flowers`,项目中已提供[`flowers`](./datasets/flowers/)迷你数据集进行试用,解压即可,完整数据集请从以下官网下载:
- https://www.kaggle.com/datasets/alxmamaev/flowers-recognition?resource=download
数据目录结构如下:
```
datasets/flowers
├── train
├── ├── daisy
├── ├── ├── xxx.jpg
├── ├── └── xxx.jpg
├── ├── dandelion
├── ├── ├── xxx.jpg
├── ├── └── xxx.jpg
├── ├── rose
├── ├── ├── xxx.jpg
├── ├── └── xxx.jpg
├── ├── sunflower
├── ├── ├── xxx.jpg
├── ├── └── xxx.jpg
├── └── tulip
├── ├── ├── xxx.jpg
├── ├── └── xxx.jpg
└── val
├── ├── daisy
├── ├── ├── xxx.jpg
├── ├── └── xxx.jpg
├── ├── dandelion
├── ├── ├── xxx.jpg
├── ├── └── xxx.jpg
├── ├── rose
├── ├── ├── xxx.jpg
├── ├── └── xxx.jpg
├── ├── sunflower
├── ├── ├── xxx.jpg
├── ├── └── xxx.jpg
├── └── tulip
├── ├── ├── xxx.jpg
├── ├── └── xxx.jpg
```
## 训练
### 单机单卡
```
python train.py --data_path "./datasets/flowers" --num_classes 5 --input_size 256 --gpu 0 # params: 2.383641M
```
更多资料可参考源项目的[`readme_origin`](./readme_origin.md)
## 推理
```
python predict.py
# MODEL_PATH = './checkpoints/model_MNV4ConvSmall_seed901_best.pt' # 使用MNV4ConvSmall训练权重,训练结果位于checkpoints下。
```
## result
`输入:`
```
"results/6089825811_80f253fbe1.jpg"
```
`输出:`
```
Vertification picture: 6089825811_80f253fbe1.jpg
Recognition result: daisy
Recognition confidence: 0.9952988
```
### 精度
max epoch为300,推理框架:pytorch。
| device | Train_Loss | Train_Acc@1 |
|:---------:|:------:|:------:|
| DCU Z100L | 0.25923 | 94.460 |
| GPU V100S | 0.29128 | 90.720 |
## 应用场景
### 算法类别
`图像识别`
### 热点应用行业
`制造,电商,医疗,能源,教育`
## 源码仓库及问题反馈
- http://developer.sourcefind.cn/codes/modelzoo/mobilenetv4_pytorch.git
## 参考资料
- https://github.com/Reversev/Deeplearning_pytorch/blob/master/CV_net/MobileNetv4/predict.py
- https://github.com/tensorflow/models/blob/master/official/vision/modeling/backbones/mobilenet.py
- https://github.com/jiaowoguanren0615/MobileNetV4/tree/main
- https://www.jianshu.com/p/992f0ebf656a