添加README等

188f0cfa · suily · ed4c40c7 · 188f0cfa
Commit 188f0cfa authored Aug 29, 2024 by suily
Show whitespace changes
Inline Side-by-side

Showing with 2 additions and 2 deletions

README.md README.md +2 -2

No files found.
--- a/README.md
+++ b/README.md
@@ -3,8 +3,7 @@
 `An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale`
 - https://arxiv.org/abs/2010.11929
 ## 模型结构
-ViT主要包括patch embeding、transformer encoder、MLP head三部分：以图像块的线性嵌入为输入、添加位置嵌入和可学习的cls_token（patch embeding），并直接应用无decoder的Transformer进行学习。
+ViT主要包括patch embeding、transformer encoder、MLP head三部分：以图像块的线性嵌入为输入、添加位置嵌入和可学习的cls_token（patch embeding），并直接应用无decoder的Transformer进行学习。由于没有归纳偏置，ViT在中小型数据集上性能不如CNN，但当模型和数据量提升时性能会持续提升。
-由于没有归纳偏置，ViT在中小型数据集上性能不如CNN，但当模型和数据量提升时性能会持续提升。
 <div align=center>
    <img src="./doc/vit.png"/>
 </div>
@@ -79,6 +78,7 @@ pip install tensorflow-cpu==2.13.1
 ## 数据集
 `cifar10  cifar100`
 数据集由tensorflow_datasets自动下载和处理，相关代码见vision_transformer/vit_jax/input_pipeline.py
 注：若发生错误All attempts to get a Google authentication bearer token failed..，按以下代码更改
 ```
 vim /usr/local/lib/python3.10/site-packages/tensorflow_datasets/core/utils/gcs_utils.py