Commit a069a456 authored by liangjing's avatar liangjing
Browse files

update readme.md

parent f6a2f5ef
...@@ -5,6 +5,16 @@ Minogo是一个基于深度强化学习的围棋程序,模型灵感来源于Go ...@@ -5,6 +5,16 @@ Minogo是一个基于深度强化学习的围棋程序,模型灵感来源于Go
## 模型结构 ## 模型结构
Minigo的核心是AlphaZero论文中描述的强化学习循环。简单地说,使用当前一代网络权重的selfplay被用来生成游戏,这些游戏被用作训练数据来生成下一代网络权重。 Minigo的核心是AlphaZero论文中描述的强化学习循环。简单地说,使用当前一代网络权重的selfplay被用来生成游戏,这些游戏被用作训练数据来生成下一代网络权重。
## 目标精度
50% win rate vs. checkpoint
## MLPerf代码参考版本
版本:v2.1
原始代码位置:https://github.com/mlcommons/training_results_v2.1/tree/main/NVIDIA/benchmarks/minigo/implementations/tensorflow-22.09
## 数据集 ## 数据集
训练数据:所有的训练数据都是在强化学习循环的selfplay阶段生成的。 训练数据:所有的训练数据都是在强化学习循环的selfplay阶段生成的。
唯一需要下载的数据是checkpoint以及target model,下载数据可按照下述进行: 唯一需要下载的数据是checkpoint以及target model,下载数据可按照下述进行:
......
Markdown is supported
0% or .
You are about to add 0 people to the discussion. Proceed with caution.
Finish editing this message first!
Please register or to comment