README.md 735 Bytes
Newer Older
PanZezhong's avatar
PanZezhong committed
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
# InfiniCore-Infer

本项目是基于 [`InfiniCore`](https://github.com/InfiniTensor/InfiniCore) 的推理引擎。

## 使用方式

- 编译并安装 `InfiniCore` 。注意根据提示设置好 `INFINI_ROOT` 环境变量(默认为 `$HOME/.infini`)。

- 编译并安装 `InfiniCore-Infer`

```bash
xmake && xmake install
```

- 运行模型推理测试

```bash
python jiuge.py [--cpu | --nvidia | --cambricon | --ascend | --metax | --moore] <path/to/model_dir> [n_device]
```

- 部署模型推理服务

```bash
24
25
26
launch_server.py [-h] [--dev {cpu,nvidia,cambricon,ascend,metax,moore}]
                        [--model-path MODEL_PATH] [--ndev NDEV] [--max-batch MAX_BATCH]
                        [--max-tokens MAX_TOKENS]
PanZezhong's avatar
PanZezhong committed
27
```