添加README等

a8126505 · suily · e4399a52 · a8126505
Commit a8126505 authored Aug 29, 2024 by suily
Hide whitespace changes
Inline Side-by-side

Showing with 5 additions and 0 deletions

README.md README.md +5 -0

No files found.
--- a/README.md
+++ b/README.md
@@ -11,10 +11,15 @@ ViT主要包括patch embeding、transformer encoder、MLP head三部分：以图
 ## 算法原理
 整个模型结构可以分为五个步骤进行：
 1、将图片切分成多个patch。
 2、将得到的patches经过一个线性映射层后得到多个token embedding。
 3、将得到的多个token embedding concat一个额外的cls_token，然后和位置编码相加，构成完整的encoder模块的输入。
 4、 将相加后的结果传入Transformer Encoder模块。
 5、Transformer Encoder 模块的输出经过MLP Head 模块做分类输出。
 <div align=center>