修改readme文档格式

3a34c76d · liucong · 0532a882 · 3a34c76d
Commit 3a34c76d authored Oct 16, 2023 by liucong
Hide whitespace changes
Inline Side-by-side

Showing with 64 additions and 40 deletions

README.md README.md +64 -40

No files found.
--- a/README.md
+++ b/README.md
-# Bidirectional Encoder Representation from Transformers(BERT)
+# BERT

-## 模型介绍
-BERT的全称为Bidirectional Encoder Representation from Transformers，是一个预训练的语言表征模型。它强调了不再像以往一样采用传统的单向语言模型或者把两个单向语言模型进行浅层拼接的方法进行预训练，而是采用新的masked language model（MLM），以致能生成深度的双向语言表征。
+## 论文
+Bidirectional Encoder Representation from Transformers
+
+- https://browse.arxiv.org/pdf/1810.04805.pdf

 ## 模型结构
-以往的预训练模型的结构会受到单向语言模型（从左到右或者从右到左）的限制，因而也限制了模型的表征能力，使其只能获取单方向的上下文信息。而BERT利用MLM进行预训练并且采用深层的双向Transformer组件（单向的Transformer一般被称为Transformer decoder，其每一个token（符号）只会attend到目前往左的token。而双向的Transformer则被称为Transformer encoder，其每一个token会attend到所有的token）来构建整个模型，因此最终生成能融合左右上下文信息的深层双向语言表征。
+以往的预训练模型的结构会受到单向语言模型（从左到右或者从右到左）的限制，因而也限制了模型的表征能力，使其只能获取单方向的上下文信息。而BERT利用MLM进行预训练并且采用深层的双向Transformer组件（单向的Transformer一般被称为Transformer decoder，其每一个token（符号）只会attend到目前往左的token。而双向的Transformer则被称为Transformer encoder，其每一个token会attend到所有的token）来构建整个模型，因此最终生成能融合上下文信息的深层双向语言表征。

-## Python版本推理
+<img src="./Doc/Images/Bert_01.png" style="zoom:100%;" align=middle>

-本次采用经典的Bert模型完成问题回答任务，模型和分词文件下载链接：https://pan.baidu.com/s/1yc30IzM4ocOpTpfFuUMR0w, 提取码：8f1a, 将bertsquad-10.onnx文件和uncased_L-12_H-768_A-12分词文件保存在Resource/文件夹下。下面介绍如何运行python代码示例，Python示例的详细说明见Doc目录下的Tutorial_Python.md。
+## 算法原理

-### 下载镜像
+BERT的全称为Bidirectional Encoder Representation from Transformers，是一个预训练的语言表征模型。它强调了不再像以往一样采用传统的单向语言模型或者把两个单向语言模型进行浅层拼接的方法进行预训练，而是采用新的masked language model（MLM），以致能生成深度的双向语言表征。具体方法通过将Token Embedding、Segment Embedding、Position Embedding输入到BERT模型中进行推理，并经过下图所示的数据后处理得到最终的推理结果。

-下载MIGraphX镜像： 
+<img src="./Doc/Images/Bert_04.png" style="zoom:100%;" align=middle>

-```python
+## 环境配置
+
+### Docker
+
+拉取镜像：
+
+```plaintext
 docker pull sugonhub/migraphx:3.2.1-centos7.6-dtk-23.04.1-py38
 ```

-### 设置Python环境变量
+创建并启动容器，安装相关依赖：
+
+```plaintext
+docker run --shm-size 16g --network=host --name=bert_migraphx --privileged --device=/dev/kfd --device=/dev/dri --group-add video --cap-add=SYS_PTRACE --security-opt seccomp=unconfined -v $PWD/bert_migraphx:/home/bert_migraphx -it <Your Image ID> /bin/bash
+
+# 激活dtk
+source /opt/dtk/env.sh
+```
+
+## 数据集
+
+在界面中根据提示输入问题，模型预测出答案。
+
+## 推理
+
+### Python版本推理
+
+本次采用经典的Bert模型完成问题回答任务，模型和分词文件下载链接：https://pan.baidu.com/s/1yc30IzM4ocOpTpfFuUMR0w, 提取码：8f1a, 将bertsquad-10.onnx文件和uncased_L-12_H-768_A-12分词文件保存在Resource/文件夹下。下面介绍如何运行python代码示例，Python示例的详细说明见Doc目录下的Tutorial_Python.md。
+
+#### 设置环境变量

 ```
 export PYTHONPATH=/opt/dtk/lib:$PYTHONPATH
 ```

-### 安装依赖
+#### 运行示例

 ```python
 # 进入bert migraphx工程根目录
@@ -34,45 +61,24 @@ cd <path_to_bert_migraphx>
 cd Python/

 # 安装依赖
-pip install -r requirements.txt
-```
-
-### 运行示例
+pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple

-```python
+# 运行示例
 python bert.py
 ```

-输出结果为：
-
-```
-“1”："open-source exascale-class platform for accelerated computing",
-"2"："(Tensorflow / PyTorch)",
-"3"："scale"
-```
-
-输出结果中，问题id对应预测概率值最大的答案。
-
-## C++版本推理
+### C++版本推理

 本次采用经典的Bert模型完成问题回答任务，模型和分词文件下载链接：https://pan.baidu.com/s/1yc30IzM4ocOpTpfFuUMR0w, 提取码：8f1a, 将bertsquad-10.onnx文件和uncased_L-12_H-768_A-12分词文件保存在Resource/文件夹下。下面介绍如何运行C++代码示例，C++示例的详细说明见Doc目录下的Tutorial_Cpp.md。

-### 下载镜像

-下载MIGraphX镜像： 
-
-```
-docker pull sugonhub/migraphx:3.2.1-centos7.6-dtk-23.04.1-py38
-```
-
-
-### 构建工程
+#### 构建工程

 ```
 rbuild build -d depend
 ```

-### 设置环境变量
+#### 设置环境变量

 将依赖库依赖加入环境变量LD_LIBRARY_PATH，在~/.bashrc中添加如下语句：

@@ -86,7 +92,7 @@ export LD_LIBRARY_PATH=<path_to_bert_migraphx>/depend/lib64/:$LD_LIBRARY_PATH
 source ~/.bashrc
 ```

-### 运行示例
+#### 运行示例

 ```python
 # 进入bert migraphx工程根目录
@@ -99,12 +105,30 @@ cd build/
 ./Bert
 ```

-如下所示，在当前界面根据提示输入问题，得到预测答案。
+## result
+
+### python版本
+
+```
+“1”："open-source exascale-class platform for accelerated computing",
+"2"："(Tensorflow / PyTorch)",
+"3"："scale"
+```
+
+上述序号代表对应的问题：
+
+"1"代表“What is ROCm?”
+
+“2”代表“Which frameworks does ROCm support?”
+
+“3”代表"What is ROCm built for?"
+
+### C++版本

 ```
 question：What is ROCm?
 answer：open-source exascale-class platform for accelerated computing
-question：Which frameworks does ROCmsupport?
+question：Which frameworks does ROCm support?
 answer：tensorflow / pytorch
 question：What is ROCm built for?
 answer：scale