DLTSMode.rst 1.67 KB
Newer Older
kvartet's avatar
kvartet committed
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
**在 DLTS 上运行 Experiment**
=================================

NNI 支持在 `DLTS <https://github.com/microsoft/DLWorkspace.git>`__\ 上运行 Experiment ,称之为 dlts 模式。 在开始使用 NNI dlts 模式之前,应该有访问 DLTS 仪表板的账号。

设置环境
-----------------

步骤 1. 从 DLTS 仪表板中选择集群,关于仪表板地址,需咨询管理员。


.. image:: ../../img/dlts-step1.png
   :target: ../../img/dlts-step1.png
   :alt: Choose Cluster


步骤 2. 准备 NNI 配置 YAML,如下所示:

.. code-block:: yaml

   # Set this field to "dlts"
   trainingServicePlatform: dlts
   authorName: your_name
   experimentName: auto_mnist
   trialConcurrency: 2
   maxExecDuration: 3h
   maxTrialNum: 100
   searchSpacePath: search_space.json
   useAnnotation: false
   tuner:
     builtinTunerName: TPE
     classArgs:
       optimize_mode: maximize
   trial:
     command: python3 mnist.py
     codeDir: .
     gpuNum: 1
     image: msranni/nni
   # Configuration to access DLTS
   dltsConfig:
     dashboard: # Ask administrator for the cluster dashboard URL

记得将群集仪表板地址填到最后一行。

步骤 3. 打开群集的工作目录,将 NNI 配置和相关代码放入目录中。


.. image:: ../../img/dlts-step3.png
   :target: ../../img/dlts-step3.png
   :alt: Copy Config


步骤 4. 将 NNI 管理器任务提交到指定的群集。


.. image:: ../../img/dlts-step4.png
   :target: ../../img/dlts-step4.png
   :alt: Submit Job


步骤 5. 转到新创建的任务选项卡,单击端口 40000 的链接检查 Trial 的信息。


.. image:: ../../img/dlts-step5.png
   :target: ../../img/dlts-step5.png
   :alt: View NNI WebUI