Commit a069a456 authored by liangjing's avatar liangjing
Browse files

update readme.md

parent f6a2f5ef
......@@ -5,6 +5,16 @@ Minogo是一个基于深度强化学习的围棋程序,模型灵感来源于Go
## 模型结构
Minigo的核心是AlphaZero论文中描述的强化学习循环。简单地说,使用当前一代网络权重的selfplay被用来生成游戏,这些游戏被用作训练数据来生成下一代网络权重。
## 目标精度
50% win rate vs. checkpoint
## MLPerf代码参考版本
版本:v2.1
原始代码位置:https://github.com/mlcommons/training_results_v2.1/tree/main/NVIDIA/benchmarks/minigo/implementations/tensorflow-22.09
## 数据集
训练数据:所有的训练数据都是在强化学习循环的selfplay阶段生成的。
唯一需要下载的数据是checkpoint以及target model,下载数据可按照下述进行:
......@@ -48,7 +58,7 @@ python依赖安装:
ENV PYTHONPATH "${PYTHONPATH}:/opt/reinforcement/minigo/bazel-bin/cc"
RUN echo '/usr/local/lib/python3.8/dist-packages/tensorflow_core' > /etc/ld.so.conf.d/tensorflow.conf && ldconfig
### 训练
......
Markdown is supported
0% or .
You are about to add 0 people to the discussion. Proceed with caution.
Finish editing this message first!
Please register or to comment