how_to_download_models_zh_cn.md 1.9 KB
Newer Older
1
2
3
模型下载分为首次下载和更新模型目录,请参考对应的文档内容进行操作

# 首次下载模型文件
4

5
模型文件可以从 Hugging Face 或 Model Scope 下载,由于网络原因,国内用户访问HF可能会失败,请使用 ModelScope。
6

7
8
9
10
<details>
  <summary>方法一:从 Hugging Face 下载模型</summary>
  <p>使用python脚本 从Hugging Face下载模型文件</p>
  <pre><code>pip install huggingface_hub
11
wget https://gitee.com/myhloli/MinerU/raw/master/docs/download_models_hf.py -O download_models_hf.py
12
13
python download_models_hf.py</code></pre>
</details>
14

15
## 方法二:从 ModelScope 下载模型
16

17
### 使用python脚本 从ModelScope下载模型文件
18
19
20

```bash
pip install modelscope
21
wget https://gitee.com/myhloli/MinerU/raw/master/docs/download_models.py -O download_models.py
22
python download_models.py
23
```
24

25
python脚本会自动下载模型文件并配置好配置文件中的模型目录
26

27
配置文件可以在用户目录中找到,文件名为`magic-pdf.json`
28

29
> [!TIP]
30
> windows的用户目录为 "C:\\Users\\用户名", linux用户目录为 "/home/用户名", macOS用户目录为 "/Users/用户名"
31
32
33
34
35

# 此前下载过模型,如何更新

## 1. 通过git lfs下载过模型

36
> [!IMPORTANT]
37
> 由于部分用户反馈通过git lfs下载模型文件遇到下载不全和模型文件损坏情况,现已不推荐使用该方式下载。
38
39
> 
> 0.9.x及以后版本由于PDF-Extract-Kit 1.0更换仓库和新增layout排序模型,不能通过`git pull`命令更新,需要使用python脚本一键更新。
40

41
42
当magic-pdf <= 0.8.1时,如此前通过 git lfs 下载过模型文件,可以进入到之前的下载目录中,通过`git pull`命令更新模型。

43

44
45
46
## 2. 通过 Hugging Face 或 Model Scope 下载过模型

如此前通过 HuggingFace 或 Model Scope 下载过模型,可以重复执行此前的模型下载python脚本,将会自动将模型目录更新到最新版本。