HybridMode.rst 1.36 KB
Newer Older
kvartet's avatar
kvartet committed
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
**以混合模式进行实验**
===========================================

在混合模式下运行 NNI 意味着 NNI 将在多种培训平台上运行试验工作。 例如,NNI 可以同时将试用作业提交到远程计算机和 AML。

设置环境
-----------------

对于混合模式,NNI 目前支持的平台有 `本地平台 <LocalMode.rst>`__\ ,`远程平台 <RemoteMachineMode.rst>`__\ , `PAI <PaiMode.rst>`__ 和 `AML <./AMLMode.rst>`__\ 。 使用这些模式开始 Experiment 之前,用户应为平台设置相应的环境。 有关环境设置的详细信息,请参见相应的文档。

运行实验
-----------------

以 ``examples/trials/mnist-tfv1`` 为例。 NNI 的 YAML 配置文件如下:

.. code-block:: yaml

    experimentName: example_mnist
kvartet's avatar
kvartet committed
19
20
21
    searchSpacePath: search_space.json
    command: python3 mnist.py
    codeDir: .
kvartet's avatar
kvartet committed
22
    trialConcurrency: 2
kvartet's avatar
kvartet committed
23
    gpuNum: 1
kvartet's avatar
kvartet committed
24
25
26
27
28
29
    maxExecDuration: 1h
    maxTrialNum: 10
    tuner:
      builtinTunerName: TPE
      classArgs:
        optimize_mode: maximize
kvartet's avatar
kvartet committed
30
31
32
33
34
35
36
37
38
39
    trainingServicePlatforms:
      - remote
        machineList:
          - ip: 10.1.1.1
            username: bob
            passwd: bob123
      - local

要使用混合训练平台,用户应在 `trainingService` 字段中将训练平台设置为列表。  
目前,混合训练平台只支持 `local`, `remote`, `pai` 和 `aml` 训练平台。