Commit c256001d authored by zhuwenwen's avatar zhuwenwen
Browse files

update readme

parent 46b32f24
...@@ -2,7 +2,7 @@ ...@@ -2,7 +2,7 @@
* @Author: zhuww * @Author: zhuww
* @email: zhuww@sugon.com * @email: zhuww@sugon.com
* @Date: 2023-04-15 14:34:07 * @Date: 2023-04-15 14:34:07
* @LastEditTime: 2023-08-24 10:06:01 * @LastEditTime: 2023-10-09 17:11:01
--> -->
# PROTEINMPNN # PROTEINMPNN
## 论文 ## 论文
...@@ -44,10 +44,24 @@ docker run -it --name proteinmpnn --shm-size=32G --device=/dev/kfd --device=/de ...@@ -44,10 +44,24 @@ docker run -it --name proteinmpnn --shm-size=32G --device=/dev/kfd --device=/de
## 数据集 ## 数据集
模型数据集[PDB biunits 2021/08/02](https://files.ipd.uw.edu/pub/training_sets/pdb_2021aug02.tar.gz),数据集大小为16.5GB。 模型数据集[PDB biunits 2021/08/02](https://files.ipd.uw.edu/pub/training_sets/pdb_2021aug02.tar.gz),数据集大小为16.5GB。
用于测试此数据集的小样本[PDB biunits sample 2021/08/02](https://files.ipd.uw.edu/pub/training_sets/pdb_2021aug02_sample.tar.gz),数据集大小为47MB。 用于测试此数据集的小样本[PDB biunits sample 2021/08/02](https://files.ipd.uw.edu/pub/training_sets/pdb_2021aug02_sample.tar.gz),数据集大小为47MB。
```
pdb_2021aug02_sample/
pdb/
l3/
1l30_A.pt
1l30.pt
1l3n_B.pt
...
valid_clusters.txt
test_clusters.txt
README
list.csv
```
## 训练 ## 训练
### 单机单卡 ### 单机单卡
pip install python-dateutil
cd /opt/ProteinMPNN-main/training cd /opt/ProteinMPNN-main/training
python ./training.py \ python ./training.py \
--path_for_outputs "模型保存路径" \ --path_for_outputs "模型保存路径" \
...@@ -59,12 +73,12 @@ docker run -it --name proteinmpnn --shm-size=32G --device=/dev/kfd --device=/de ...@@ -59,12 +73,12 @@ docker run -it --name proteinmpnn --shm-size=32G --device=/dev/kfd --device=/de
分别提供了基于Pytorch的单体和多体的推理脚本。 分别提供了基于Pytorch的单体和多体的推理脚本。
### 单体 ### 单体
cd examples cd /opt/ProteinMPNN-main/examples
./submit_example_1.sh ./submit_example_1.sh
### 多体 ### 多体
cd examples cd /opt/ProteinMPNN-main/examples
./submit_example_2.sh ./submit_example_2.sh
## result ## result
...@@ -104,7 +118,7 @@ outputs/ ...@@ -104,7 +118,7 @@ outputs/
## 应用场景 ## 应用场景
### 算法类别 ### 算法类别
NLP 蛋白质结构预测
### 热点应用行业 ### 热点应用行业
医疗,科研,教育 医疗,科研,教育
......
...@@ -5,6 +5,6 @@ modelName=proteinmpnn_pytorch ...@@ -5,6 +5,6 @@ modelName=proteinmpnn_pytorch
# 模型描述 # 模型描述
modelDescription=ProteinMPNN是一种使用MPNN进行蛋白质预测的模型,该模型输入蛋白质序列和结构信息,输出蛋白质的三维结构 modelDescription=ProteinMPNN是一种使用MPNN进行蛋白质预测的模型,该模型输入蛋白质序列和结构信息,输出蛋白质的三维结构
# 应用场景(多个标签以英文逗号分割) # 应用场景(多个标签以英文逗号分割)
appScenario=推理,训练,NLP,医疗,科研,教育 appScenario=推理,训练,蛋白质结构预测,医疗,科研,教育
# 框架类型(多个标签以英文逗号分割) # 框架类型(多个标签以英文逗号分割)
frameType=pytorch frameType=pytorch
Markdown is supported
0% or .
You are about to add 0 people to the discussion. Proceed with caution.
Finish editing this message first!
Please register or to comment