"vscode:/vscode.git/clone" did not exist on "ba0913b1e9c86e94414c9a71baa31569904cd04e"
DLTSMode.md 1.34 KB
Newer Older
Chi Song's avatar
Chi Song committed
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
**在 DLTS 上运行 Experiment**
===
NNI 支持在 [DLTS](https://github.com/microsoft/DLWorkspace.git) 上运行 Experiment ,称之为 dlts 模式。 在开始使用 NNI dlts 模式之前,应该有访问 DLTS 仪表板的账号。

## 设置环境

步骤 1. 从 DLTS 仪表板中选择集群,关于仪表板地址,需咨询管理员。

![选择集群](../../img/dlts-step1.png)

步骤 2. 准备 NNI 配置 YAML,如下所示:

```yaml
# 将此字段设置为 "dlts"
trainingServicePlatform: dlts
authorName: your_name
experimentName: auto_mnist
trialConcurrency: 2
maxExecDuration: 3h
maxTrialNum: 100
searchSpacePath: search_space.json
useAnnotation: false
tuner:
  builtinTunerName: TPE
  classArgs:
    optimize_mode: maximize
trial:
  command: python3 mnist.py
  codeDir: .
  gpuNum: 1
  image: msranni/nni
# 访问 DLTS 的配置
dltsConfig:
  dashboard: # Ask administrator for the cluster dashboard URL
```

记得将群集仪表板地址填到最后一行。

步骤 3. 打开群集的工作目录,将 NNI 配置和相关代码放入目录中。

![复制配置](../../img/dlts-step3.png)

步骤 4. 将 NNI 管理器任务提交到指定的群集。

![提交 Job](../../img/dlts-step4.png)

步骤 5. 转到新创建的任务选项卡,单击端口 40000 的链接检查 Trial 的信息。

![查看 NNI Web 界面](../../img/dlts-step5.png)