update readme.md

a069a456 · liangjing · f6a2f5ef · a069a456
Commit a069a456 authored Apr 11, 2023 by liangjing
Hide whitespace changes
Inline Side-by-side

Showing with 11 additions and 1 deletion

README.md README.md +11 -1

No files found.
--- a/README.md
+++ b/README.md
@@ -5,6 +5,16 @@ Minogo是一个基于深度强化学习的围棋程序，模型灵感来源于Go
 ## 模型结构
 Minigo的核心是AlphaZero论文中描述的强化学习循环。简单地说，使用当前一代网络权重的selfplay被用来生成游戏，这些游戏被用作训练数据来生成下一代网络权重。
+## 目标精度
+50% win rate vs. checkpoint
+## MLPerf代码参考版本
+版本：v2.1
+原始代码位置：https://github.com/mlcommons/training_results_v2.1/tree/main/NVIDIA/benchmarks/minigo/implementations/tensorflow-22.09
 ## 数据集
 训练数据：所有的训练数据都是在强化学习循环的selfplay阶段生成的。
 唯一需要下载的数据是checkpoint以及target model，下载数据可按照下述进行：
@@ -48,7 +58,7 @@ python依赖安装：
    ENV PYTHONPATH "${PYTHONPATH}:/opt/reinforcement/minigo/bazel-bin/cc"
    RUN echo '/usr/local/lib/python3.8/dist-packages/tensorflow_core' > /etc/ld.so.conf.d/tensorflow.conf && ldconfig
 ### 训练