Commits · d66e6988bca209f032d4e16d2106fb371620220d · OpenDAS / ColossalAI

29 Dec, 2023 1 commit
- support linear accumulation fusion (#5199) · 02d2328a
  flybird11111 authored Dec 29, 2023
```
support linear accumulation fusion

support linear accumulation fusion

fix
```
  02d2328a
07 Nov, 2023 1 commit

[Inference] Fix bug in ChatGLM2 Tensor Parallelism (#5014) · ef4c14a5

Jianghai authored Nov 07, 2023

* fix bug

* fix

* fix multiquery

* fix multiquery

---------

Co-authored-by: CjhHa1 <cjh18671720497outlook.com>

ef4c14a5

19 Sep, 2023 1 commit

[misc] update pre-commit and run all files (#4752) · 079bf3cb

Hongxin Liu authored Sep 19, 2023

* [misc] update pre-commit

* [misc] run pre-commit

* [misc] remove useless configuration files

* [misc] ignore cuda for clang-format

079bf3cb

28 Aug, 2023 1 commit
- [shardformer/fix overlap bug] fix overlap bug, add overlap as an option in shardco… (#4516) · c554b7f5
  Bin Jia authored Aug 28, 2023
```
* fix overlap bug and support bert, add overlap as an option in shardconfig

* support overlap for chatglm and bloom
```
  c554b7f5
22 Aug, 2023 1 commit

[shardformer] chatglm support sequence parallel (#4482) · 59e252ec

flybird11111 authored Aug 22, 2023

* [shardformer] chatglm support sequence parallel

[shardformer] chatglm support sequence parallel

[shardformer] chatglm support sequence parallel

[shardformer] chatglm support sequence parallel

[shardformer] chatglm support sequence parallel

[shardformer] chatglm support sequence parallel

* fix

fix

fix

fix

59e252ec

16 Aug, 2023 1 commit

[shardformer/sequence parallel] Cherry pick commit to new branch (#4450) · 424629fe

Bin Jia authored Aug 16, 2023

* [shardformer/sequence parallel] Support sequence parallel for gpt2 (#4384)

* [sequence parallel] add sequence parallel linear col/row support (#4336)

* add sequence parallel linear col/row support

* add annotation

* add annotation

* add support for gpt2 fused qkv linear layer

* support sequence parallel in GPT2

* add docstring and note

* add requirments

* remove unused flash-attb

* modify flash attn test

* modify flash attn setting

* modify flash attn code

* add assert before divide, rename forward function

* [shardformer/test] fix gpt2 test with seq-parallel

* [shardformer/sequence parallel] Overlap input gather and grad computation during col backward (#4401)

* overlap gather input / grad computing during col backward

* modify test for overlap

* simplify code

* fix code and modify cuda stream synchronize

* [shardformer/sequence parallel] polish code

424629fe

15 Aug, 2023 4 commits

[shardformer] rewrite tests for opt/bloom/llama/vit/chatglm (#4395) · 7711bd52

Baizhou Zhang authored Aug 11, 2023

* rewrite opt tests

* rewrite llama tests

* rewrite bloom & vit tests

* rewrite chatglm tests

* fix LinearCol for classfiers

* add judge for other tp layers, fix lazy init in util

7711bd52

[shardformer] support inplace sharding (#4251) · d921ce83

Hongxin Liu authored Jul 20, 2023

* [shardformer] embedding support inplace sharding

* [shardformer] linear support inplace sharding

* [shardformer] layernorm support inplace sharding

* [shardformer] qkv support inplace sharding

* [test] update shardformer layer test

* [shardformer] fix shared param sharding

* [shardformer] fix bert policy

* [shardformer] fix bloom policy

* [shardformer] fix llama policy

* [shardformer] fix opt policy

* [shardformer] fix t5 policy

* [shardformer] fix fused qkv linear

* [shardformer] fix bugs

* force sync

* [test] fix bugs

* [test] fix transformer version

d921ce83

[pipeline] Add Pipeline Forward for GPT2Model Shardformer (#4224) · 208ac8f2

Baizhou Zhang authored Jul 13, 2023

* * fix typehint & docstring in sharder.py

* * update pipeline forward for GPT2Model

* * add test for pipeline forward of GPT2Model

* * add cache cleaning in gpt2 test

* * change assert to raise command

208ac8f2

[shardformer] support lazy init (#4202) · 890774b2

Hongxin Liu authored Jul 10, 2023

* [shardformer] support lazy init

* [shardformer] linear support lazy init

* [shardformer] embedding support lazy init

* [shardformer] norm support lazy init

* [shardformer] fused linear support lazy init

* [test] update shardformer test layer

* [test] shardformer with lazy init fit ddp

* [lazy] hotfix deepcopy of param

* [shardformer] fix bert policy and update test

* [shardformer] fix bloom policy and update test

* [shardformer] fix opt policy and update test

* [shardformer] fix t5 policy and update test

* [shardformer] fix gpt2 policy and update test

* [shardformer] fix llama policy and update test

890774b2

04 Jul, 2023 5 commits
- [shardformer] supported bloom model (#4098) · b1c29015
  Frank Lee authored Jun 28, 2023
  
  b1c29015
- [shardformer] supported fused qkv checkpoint (#4073) · 70c58cfd
  Frank Lee authored Jun 23, 2023
  
  70c58cfd
- [shardformer] support module saving and loading (#4062) · 8eb09a4c
  Frank Lee authored Jun 22, 2023
```
* [shardformer] support module saving and loading

* polish code
```
  8eb09a4c
- [shardformer] refactored the shardformer layer structure (#4053) · f22ddace
  Frank Lee authored Jun 21, 2023
  
  f22ddace
- [shardformer] add gpt2 test and layer class refactor (#4041) · 4021b9a8
  FoolPlayer authored Jun 20, 2023
```
* add gpt2 test and layer class refactor

* add dropout in gpt2 policy
```
  4021b9a8