change nn to models (#3032)

c21b11ed · Fazzie-Maqianli · GitHub · 4269196c · c21b11ed · c21b11ed
Unverified Commit c21b11ed authored Mar 07, 2023 by Fazzie-Maqianli Committed by GitHub Mar 07, 2023
20 changed files
--- a/applications/ChatGPT/README.md
+++ b/applications/ChatGPT/README.md
@@ -41,7 +41,8 @@ Simplest usage:
 ```python
 from chatgpt.trainer import PPOTrainer
 from chatgpt.trainer.strategies import ColossalAIStrategy
-from chatgpt.nn import GPTActor, GPTCritic, RewardModel
+from chatgpt.models.gpt import GPTActor, GPTCritic
+from chatgpt.models.base import RewardModel
 from copy import deepcopy
 from colossalai.nn.optimizer import HybridAdam


--- a/applications/ChatGPT/benchmarks/benchmark_gpt_dummy.py
+++ b/applications/ChatGPT/benchmarks/benchmark_gpt_dummy.py
@@ -4,7 +4,8 @@ from copy import deepcopy
 import torch
 import torch.distributed as dist
 import torch.nn as nn
-from chatgpt.nn import GPTActor, GPTCritic, RewardModel
+from chatgpt.models.base import RewardModel
+from chatgpt.models.gpt import GPTActor, GPTCritic
 from chatgpt.trainer import PPOTrainer
 from chatgpt.trainer.callbacks import PerformanceEvaluator
 from chatgpt.trainer.strategies import ColossalAIStrategy, DDPStrategy, Strategy

--- a/applications/ChatGPT/benchmarks/benchmark_opt_lora_dummy.py
+++ b/applications/ChatGPT/benchmarks/benchmark_opt_lora_dummy.py
@@ -4,7 +4,8 @@ from copy import deepcopy
 import torch
 import torch.distributed as dist
 import torch.nn as nn
-from chatgpt.nn import OPTActor, OPTCritic, RewardModel
+from chatgpt.models.base import RewardModel
+from chatgpt.models.opt import OPTActor, OPTCritic
 from chatgpt.trainer import PPOTrainer
 from chatgpt.trainer.callbacks import PerformanceEvaluator
 from chatgpt.trainer.strategies import ColossalAIStrategy, DDPStrategy, Strategy

--- a/applications/ChatGPT/chatgpt/experience_maker/base.py
+++ b/applications/ChatGPT/chatgpt/experience_maker/base.py
@@ -4,7 +4,7 @@ from typing import Optional

 import torch
 import torch.nn as nn
-from chatgpt.nn.actor import Actor
+from chatgpt.models.base import Actor


 @dataclass

--- a/applications/ChatGPT/chatgpt/experience_maker/naive.py
+++ b/applications/ChatGPT/chatgpt/experience_maker/naive.py
 import torch
-from chatgpt.nn.utils import compute_reward, normalize
+from chatgpt.models.utils import compute_reward, normalize

 from .base import Experience, ExperienceMaker


--- a/applications/ChatGPT/chatgpt/models/__init__.py
+++ b/applications/ChatGPT/chatgpt/models/__init__.py
+from .base import Actor, Critic, RewardModel
+from .loss import PairWiseLoss, PolicyLoss, PPOPtxActorLoss, ValueLoss
+
+__all__ = ['Actor', 'Critic', 'RewardModel', 'PolicyLoss', 'ValueLoss', 'PPOPtxActorLoss', 'PairWiseLoss']
--- a/applications/ChatGPT/chatgpt/models/base/__init__.py
+++ b/applications/ChatGPT/chatgpt/models/base/__init__.py
+from .actor import Actor
+from .critic import Critic
+from .reward_model import RewardModel
+
+__all__ = ['Actor', 'Critic', 'RewardModel']
--- a/applications/ChatGPT/chatgpt/nn/actor.py
+++ b/applications/ChatGPT/chatgpt/nn/actor.py
@@ -4,9 +4,9 @@ import torch
 import torch.nn as nn
 import torch.nn.functional as F

-from .generation import generate
-from .lora import LoRAModule
-from .utils import log_probs_from_logits
+from ..generation import generate
+from ..lora import LoRAModule
+from ..utils import log_probs_from_logits


 class Actor(LoRAModule):

--- a/applications/ChatGPT/chatgpt/nn/critic.py
+++ b/applications/ChatGPT/chatgpt/nn/critic.py
@@ -3,8 +3,8 @@ from typing import Optional
 import torch
 import torch.nn as nn

-from .lora import LoRAModule
-from .utils import masked_mean
+from ..lora import LoRAModule
+from ..utils import masked_mean


 class Critic(LoRAModule):

--- a/applications/ChatGPT/chatgpt/nn/reward_model.py
+++ b/applications/ChatGPT/chatgpt/nn/reward_model.py
@@ -3,7 +3,7 @@ from typing import Optional
 import torch
 import torch.nn as nn

-from .lora import LoRAModule
+from ..lora import LoRAModule


 class RewardModel(LoRAModule):

--- a/applications/ChatGPT/chatgpt/models/bloom/__init__.py
+++ b/applications/ChatGPT/chatgpt/models/bloom/__init__.py
+from .bloom_actor import BLOOMActor
+from .bloom_critic import BLOOMCritic
+from .bloom_rm import BLOOMRM
+
+__all__ = ['BLOOMActor', 'BLOOMCritic', 'BLOOMRM']
--- a/applications/ChatGPT/chatgpt/nn/bloom_actor.py
+++ b/applications/ChatGPT/chatgpt/nn/bloom_actor.py
@@ -3,7 +3,7 @@ from typing import Optional
 import torch
 from transformers import BloomConfig, BloomForCausalLM, BloomModel

-from .actor import Actor
+from ..base import Actor


 class BLOOMActor(Actor):

--- a/applications/ChatGPT/chatgpt/nn/bloom_critic.py
+++ b/applications/ChatGPT/chatgpt/nn/bloom_critic.py
@@ -4,7 +4,7 @@ import torch
 import torch.nn as nn
 from transformers import BloomConfig, BloomForCausalLM, BloomModel

-from .critic import Critic
+from ..base import Critic


 class BLOOMCritic(Critic):

--- a/applications/ChatGPT/chatgpt/nn/bloom_rm.py
+++ b/applications/ChatGPT/chatgpt/nn/bloom_rm.py
@@ -3,7 +3,7 @@ from typing import Optional
 import torch.nn as nn
 from transformers import BloomConfig, BloomForCausalLM, BloomModel

-from .reward_model import RewardModel
+from ..base import RewardModel


 class BLOOMRM(RewardModel):

--- a/applications/ChatGPT/chatgpt/nn/generation.py
+++ b/applications/ChatGPT/chatgpt/nn/generation.py
--- a/applications/ChatGPT/chatgpt/nn/generation_utils.py
+++ b/applications/ChatGPT/chatgpt/nn/generation_utils.py
--- a/applications/ChatGPT/chatgpt/models/gpt/__init__.py
+++ b/applications/ChatGPT/chatgpt/models/gpt/__init__.py
+from .gpt_actor import GPTActor
+from .gpt_critic import GPTCritic
+from .gpt_rm import GPTRM
+
+__all__ = ['GPTActor', 'GPTCritic', 'GPTRM']
--- a/applications/ChatGPT/chatgpt/nn/gpt_actor.py
+++ b/applications/ChatGPT/chatgpt/nn/gpt_actor.py
@@ -3,7 +3,7 @@ from typing import Optional
 from transformers.models.gpt2.configuration_gpt2 import GPT2Config
 from transformers.models.gpt2.modeling_gpt2 import GPT2LMHeadModel

-from .actor import Actor
+from ..base import Actor


 class GPTActor(Actor):

--- a/applications/ChatGPT/chatgpt/nn/gpt_critic.py
+++ b/applications/ChatGPT/chatgpt/nn/gpt_critic.py
@@ -4,7 +4,7 @@ import torch.nn as nn
 from transformers.models.gpt2.configuration_gpt2 import GPT2Config
 from transformers.models.gpt2.modeling_gpt2 import GPT2Model

-from .critic import Critic
+from ..base import Critic


 class GPTCritic(Critic):

--- a/applications/ChatGPT/chatgpt/nn/gpt_rm.py
+++ b/applications/ChatGPT/chatgpt/nn/gpt_rm.py
@@ -4,7 +4,7 @@ import torch.nn as nn
 from transformers.models.gpt2.configuration_gpt2 import GPT2Config
 from transformers.models.gpt2.modeling_gpt2 import GPT2Model

-from .reward_model import RewardModel
+from ..base import RewardModel


 class GPTRM(RewardModel):