Skip to content
GitLab
Menu
Projects
Groups
Snippets
Loading...
Help
Help
Support
Community forum
Keyboard shortcuts
?
Submit feedback
Contribute to GitLab
Sign in / Register
Toggle navigation
Menu
Open sidebar
ModelZoo
MLPerf_MiniGo_tensorflow
Commits
a069a456
Commit
a069a456
authored
Apr 11, 2023
by
liangjing
Browse files
update readme.md
parent
f6a2f5ef
Changes
1
Hide whitespace changes
Inline
Side-by-side
Showing
1 changed file
with
11 additions
and
1 deletion
+11
-1
README.md
README.md
+11
-1
No files found.
README.md
View file @
a069a456
...
@@ -5,6 +5,16 @@ Minogo是一个基于深度强化学习的围棋程序,模型灵感来源于Go
...
@@ -5,6 +5,16 @@ Minogo是一个基于深度强化学习的围棋程序,模型灵感来源于Go
## 模型结构
## 模型结构
Minigo的核心是AlphaZero论文中描述的强化学习循环。简单地说,使用当前一代网络权重的selfplay被用来生成游戏,这些游戏被用作训练数据来生成下一代网络权重。
Minigo的核心是AlphaZero论文中描述的强化学习循环。简单地说,使用当前一代网络权重的selfplay被用来生成游戏,这些游戏被用作训练数据来生成下一代网络权重。
## 目标精度
50% win rate vs. checkpoint
## MLPerf代码参考版本
版本:v2.1
原始代码位置:https://github.com/mlcommons/training_results_v2.1/tree/main/NVIDIA/benchmarks/minigo/implementations/tensorflow-22.09
## 数据集
## 数据集
训练数据:所有的训练数据都是在强化学习循环的selfplay阶段生成的。
训练数据:所有的训练数据都是在强化学习循环的selfplay阶段生成的。
唯一需要下载的数据是checkpoint以及target model,下载数据可按照下述进行:
唯一需要下载的数据是checkpoint以及target model,下载数据可按照下述进行:
...
@@ -48,7 +58,7 @@ python依赖安装:
...
@@ -48,7 +58,7 @@ python依赖安装:
ENV PYTHONPATH "${PYTHONPATH}:/opt/reinforcement/minigo/bazel-bin/cc"
ENV PYTHONPATH "${PYTHONPATH}:/opt/reinforcement/minigo/bazel-bin/cc"
RUN echo '/usr/local/lib/python3.8/dist-packages/tensorflow_core' > /etc/ld.so.conf.d/tensorflow.conf && ldconfig
RUN echo '/usr/local/lib/python3.8/dist-packages/tensorflow_core' > /etc/ld.so.conf.d/tensorflow.conf && ldconfig
### 训练
### 训练
...
...
Write
Preview
Markdown
is supported
0%
Try again
or
attach a new file
.
Attach a file
Cancel
You are about to add
0
people
to the discussion. Proceed with caution.
Finish editing this message first!
Cancel
Please
register
or
sign in
to comment