Added switch in inference flow for using sequence embedding instead of MSAs.

- Added a `seq_emb` bool flag to `data_pipeline > process_fasta()` - In `seqemb_mode` use dummy MSA features instead of full ones.

Added switch in inference flow for using sequence embedding instead of MSAs.
- Added a `seq_emb` bool flag to `data_pipeline > process_fasta()` - In `seqemb_mode` use dummy MSA features instead of full ones.
19d090cb · Sachin Kadyan · e40900d8 · 19d090cb
Commit 19d090cb authored Oct 14, 2022 by Sachin Kadyan
Hide whitespace changes
Inline Side-by-side

Showing with 5 additions and 2 deletions

openfold/data/data_pipeline.py openfold/data/data_pipeline.py +5 -2

No files found.
--- a/openfold/data/data_pipeline.py
+++ b/openfold/data/data_pipeline.py
@@ -643,6 +643,7 @@ class DataPipeline:
        fasta_path: str,
        alignment_dir: str,
        alignment_index: Optional[str] = None,
+        seqemb_mode: bool = False,
    ) -> FeatureDict:
        """Assembles features for a single sequence in a FASTA file""" 
        with open(fasta_path) as f:
@@ -668,8 +669,10 @@ class DataPipeline:
            description=input_description,
            num_res=num_res,
        )
+        if seqemb_mode:
-        msa_features = self._process_msa_feats(alignment_dir, input_sequence, alignment_index)
+            msa_features = make_dummy_msa_feats(input_sequence)
+        else:
+            msa_features = self._process_msa_feats(alignment_dir, input_sequence, alignment_index)
        return {
            **sequence_features,