update readme std

527317eb · zhuwenwen · 5aa6ee00 · 527317eb · 527317eb · 527317eb
Commit 527317eb authored Sep 04, 2023 by zhuwenwen
Hide whitespace changes
Inline Side-by-side

Showing with 29 additions and 5 deletions

README.md README.md +14 -5

docs/alphafold2.png docs/alphafold2.png +0 -0

docs/result_pdb.png docs/result_pdb.png +0 -0

pkl2plddt.py pkl2plddt.py +15 -0

No files found.
--- a/README.md
+++ b/README.md
@@ -11,6 +11,8 @@
 ## 模型结构
 模型核心是一个基于Transformer架构的神经网络，包括两个主要组件：Sequence to Sequence Model和Structure Model，这两个组件通过迭代训练进行优化，以提高其预测准确性。
+![img](./docs/alphafold2.png)
 ## 算法原理
 AlphaFold2通过从蛋白质序列和结构数据中提取信息，使用神经网络模型来预测蛋白质三维结构。
@@ -35,7 +37,7 @@ docker run -it --name alphafold --shm-size=32G  --device=/dev/kfd --device=/dev/
 测试目录：
-`/opt/docker/test/alphafold`
+`/opt/docker/tests/alphafold`
 ## 数据集
 推荐使用AlphaFold2中的开源数据集，包括BFD、MGnify、PDB70、Uniclust、Uniref90等,数据集大小约3TB。
@@ -67,8 +69,7 @@ docker run -it --name alphafold --shm-size=32G  --device=/dev/kfd --device=/dev/
 或者使用`./run_monomer.sh`
 #### 单体推理参数说明
-monomer.fasta为推理的单体序列；--output_dir为输出目录；--model_preset选择模型配置；--run_relax=true为进行relax操作；--use_gpu_relax=true为使用gpu进行relax操作（速度更快，但可能不太稳定），--use_gpu_relax=false为使用CPU进行relax操作（速度慢，但稳定）；
+monomer.fasta为推理的单体序列；`--output_dir`为输出目录；`--model_preset`选择模型配置；`--run_relax=true`为进行relax操作；`--use_gpu_relax=true`为使用gpu进行relax操作（速度更快，但可能不太稳定），`--use_gpu_relax=false`为使用CPU进行relax操作（速度慢，但稳定）；若添加--use_precomputed_msas=true则可以加载已经搜索对齐的序列，否则默认进行搜索对齐；
-若添加--use_precomputed_msas=true则可以加载已经搜索对齐的序列，否则默认进行搜索对齐；
 ### 多体
@@ -106,10 +107,20 @@ multimer.fasta为推理的多体序列，data为数据集下载路径，其他
        ...
 ```
+![img](./docs/result_pdb.png)
 ## 精度
 测试数据：[casp14](https://www.predictioncenter.org/casp14/targetlist.cgi)、[uniprot](https://www.uniprot.org/)，
 使用的加速卡:1张 DCU 1代-16G
+1、计算lddt的值
+    python3 run_alphafold.py
+    其中，data_path为推理生成的pkl文件路径。
+2、其它精度值计算：[https://zhanggroup.org/TM-score/](https://zhanggroup.org/TM-score/)
 准确性数据：
 | 数据类型 | 序列类型 | 序列标签 | 序列长度 | GDT-TS | GDT-HA | LDDT | TM score | MaxSub | RMSD |
 | :------: | :------: | :------: | :------: |:------: |:------: | :------: | :------: | :------: |:------: |
@@ -125,8 +136,6 @@ NLP
 ### 热点应用行业
 医疗,科研,教育
 ## 源码仓库及问题反馈
 * [https://developer.hpccube.com/codes/modelzoo/AlphaFold2](https://developer.hpccube.com/codes/modelzoo/AlphaFold2)

--- a/docs/alphafold2.png
+++ b/docs/alphafold2.png
--- a/docs/result_pdb.png
+++ b/docs/result_pdb.png
--- a/pkl2plddt.py
+++ b/pkl2plddt.py
+import pickle
+import numpy as np
+import sys
+np.set_printoptions(threshold=1000000000000000000)
+data_path = r'output/monomer/result_model_1.pkl'
+with open(data_path, 'rb') as f:
+  datas = pickle.load(f)
+log = open('output/T1024.txt', mode = "a+", encoding = "utf-8")
+# np.set_printoptions(threshold=5000)
+print(np.mean(datas['plddt']),file=log)