NNI 中的 PPO Tuner ================================ PPOTuner -------- 这是一个用于 NNI 神经网络架构搜索(NAS)接口的 Tuner。 它使用了 `ppo 算法 `__。 此实现继承了 `OpenAI 的 ppo2 实现 `__ 的主要逻辑,并为 NAS 场景做了适配。 mnist-nas 示例已调优,并得到以下结果: **注意:此示例正在重构中,以支持最新的 NAS 接口,完成后会重新发布示例代码。** .. image:: ../../img/ppo_mnist.png :target: ../../img/ppo_mnist.png :alt: 我们也使用 NAS 接口和 PPO Tuner 调优了 :githublink:`ENAS 论文中为图片分类所做的宏分类 ` (Trial 中 Epoch 限定为 8)。 `enas 论文 `__ 中的图 7 展示了搜索空间: .. image:: ../../img/enas_search_space.png :target: ../../img/enas_search_space.png :alt: 上图是所选的结构。 每个方块是一层,可从 6 个操作中选择。 每条虚线是直通连接,每个方块都可以有 0 或 1 条直通连接获得前面层的输出。 **注意** ,在原始的宏搜索空间中,每个方块层可选择任意条直通连接,在此实现中,仅允许 0 或 1条。 结果如下图所示(:githublink:`配置文件 `): .. image:: ../../img/ppo_cifar10.png :target: ../../img/ppo_cifar10.png :alt: