README.md 3.02 KB
Newer Older
dengjb's avatar
dengjb committed
1
# ImageGenerate by paddle 
dengjb's avatar
dengjb committed
2
3
## 一、模型介绍
基于stable diffusion的网络模型实现-文生图、图生图等进行图像的生成
dengjb's avatar
dengjb committed
4
5
主要分享如何定制自己的文图生成模型,只需要几张图片,即可定制开发自己想要的文图生成模型。
文图生成任务要求模型根据所提供的描述性文本生成一张与之相对应的图片。这极大地释放了AI的想象力,也激发了人类的创意,给视觉内容创作者、文字内容创作者和大众用户带来了方便。用户可以生成多样化创意图片,并从中汲取创意灵感,打破创意瓶颈,从而可以进行创作出更优质的作品。
dengjb's avatar
dengjb committed
6
7
8
### 1.1 模型结构
 ![模型图](./resources/pic_readme/model.png)
## 二、模型结构
dengjb's avatar
dengjb committed
9
10
11
12
13
14
15
16
17
18
文生图、图生图使用模型[MoososCap/NOVEL-MODEL]:  
默认使用该模型进行文生图、图生图等功能实现,也可切换其他模型
- MoososCap/NOVEL-MODEL:  
    - feature_extractor/preprocessor_config.json  
    - model_index.json  
    - scheduler/scheduler_config.json  
    - text_encoder/[model_config.json,model_state.pdparams] 
    - tokenizer/[added_tokens.json,merges.txt,special_tokens_map.json,tokenizer_config.json,vocab.json]  
    - unet/[config.json,model_state.pdparams] 
    - vae/[config.json, model_state.pdparams]  
dengjb's avatar
dengjb committed
19

dengjb's avatar
dengjb committed
20
21
22
23
24
超分模型:  
falsr_a,falsr_b,falsr_c,falsr 三个超分模型  
[论文地址](https://arxiv.org/abs/1901.07261)  
![模型图](./resources/pic_readme/falsr_network.png)

dengjb's avatar
dengjb committed
25
26
## 三、推理和训练
### 3.1 环境配置
dengjb's avatar
dengjb committed
27
提供[光源](https://www.sourcefind.cn/#/service-details)拉取的训练以及推理的docker镜像:
dengjb's avatar
dengjb committed
28
29
30
31
32
33
* 3.1.1 下载推理和训练镜像:
    ```bash
    docker pull image.sourcefind.cn:5000/dcu/admin/base/paddlepaddle:2.4.2-centos7.6-dtk-23.04-py39-latest  
    ```
    * 3.1.2 python依赖安装:
    ```bash
dengjb's avatar
dengjb committed
34
    pip install -r requirement.txt  
dengjb's avatar
dengjb committed
35
36
37
38
39
40
41
    ```
### 3.2 测试
    3.2.1 测试命令:
    - 测试环境、功能是否够能够正常
    ```python
    python varify.py 
    ```
dengjb's avatar
dengjb committed
42

dengjb's avatar
dengjb committed
43
44
45
46
47
### 3.3 推理\训练代码
    3.3.1 【使用jupyter进行推理】  
    命令-jupyter:
    - 运行main.ipynb
    - 根据提示步骤运行推理、训练代码
dengjb's avatar
dengjb committed
48

dengjb's avatar
dengjb committed
49
50
51
52
53
54
55
56
57
58
59
### 3.4 使用预训练模型定制化训练图像生成模型
#### 3.4.1 预训练模型采用[MoososCap/NOVEL-MODEL]  
    命令-jupyter:
    - 运行main.ipynb
    - 根据提示步骤运行推理、训练代码
#### 3.4.2 使用starble diffusion-text_inversion方法进行训练
- 论文arxiv:[论文](https://arxiv.org/abs/2208.01618)  
- 训练过程图解:  
![训练过程](./resources/pic_readme/text_inversion.jpg)

 
dengjb's avatar
dengjb committed
60

dengjb's avatar
dengjb committed
61
## 四、生成效果 
dengjb's avatar
dengjb committed
62
63
64
65
66
67
68
69

 | 文生图  | 图生图  | 定制化训练 |
 | :----: | :-----: | :------:  |
 ![文生图](./resources/pic_readme/txt2img.jpg)  | ![图生图](./resources/pic_readme/img2img.jpg) | ![定制化训练](./resources/pic_readme/train.jpg)   
  



dengjb's avatar
dengjb committed
70
## 五、源码仓库及问题反馈
dengjb's avatar
dengjb committed
71
* https://developer.hpccube.com/codes/modelzoo/imagegenerate_paddle
dengjb's avatar
dengjb committed
72
## 六、参考
dengjb's avatar
dengjb committed
73
* https://aistudio.baidu.com/aistudio/projectdetail/4905623