Commits · 496cbb0760379ce32a30c8b4542fec6bb1d5c27a · OpenDAS / ColossalAI

17 Mar, 2022 2 commits
- [hotfix] fix initialize bug with zero (#442) · 496cbb07
  Jiarui Fang authored Mar 17, 2022
  
  496cbb07
- [unitest] polish zero config in unittest (#438) · 17b8274f
  Jiarui Fang authored Mar 17, 2022
  
  17b8274f
16 Mar, 2022 3 commits
- [refactory] refactory the initialize method for new zero design (#431) · 640a6cd3
  Jiarui Fang authored Mar 16, 2022
  
  640a6cd3
- sync before creating empty grad · fce9432f
  ver217 authored Mar 16, 2022
  
  fce9432f
- [test] merge zero optim tests (#428) · f9c762df
  Jiarui Fang authored Mar 16, 2022
  
  f9c762df
15 Mar, 2022 3 commits
- [zero] cuda margin space for OS (#418) · adebb3e0
  Jiarui Fang authored Mar 15, 2022
  
  adebb3e0
- [polish] use GLOBAL_MODEL_DATA_TRACER (#417) · 56bb412e
  Jiarui Fang authored Mar 15, 2022
  
  56bb412e
- [zero] refactory ShardedOptimV2 init method (#416) · 23ba3fc4
  Jiarui Fang authored Mar 15, 2022
  
  23ba3fc4
14 Mar, 2022 3 commits
- [zero] memtracer to record cuda memory usage of model data and overall system (#395) · 21dc54e0
  Jiarui Fang authored Mar 14, 2022
  
  21dc54e0
- [zero] new interface for ShardedOptimv2 (#406) · 370f567e
  Jiarui Fang authored Mar 14, 2022
  
  370f567e
- polish unit test · 54fd37f0
  ver217 authored Mar 14, 2022
  
  54fd37f0
11 Mar, 2022 29 commits
- [zero] polish ShardedOptimV2 unittest (#385) · 3af13a2c
  Jiarui Fang authored Mar 11, 2022
```
* place params on cpu after zero init context

* polish code

* bucketzed cpu gpu tensor transter

* find a bug in sharded optim unittest

* add offload unittest for ShardedOptimV2.

* polish code and make it more robust
```
  3af13a2c
- [unit test] Refactored test cases with component func (#339) · 526a3180
  Frank Lee authored Mar 11, 2022
```
* refactored test with component func

* fixed bug
```
  526a3180
- [zero] zero init context collect numel of model (#375) · 6b600296
  Jiarui Fang authored Mar 10, 2022
  
  6b600296
- [zero] able to place params on cpu after zero init context (#365) · 44e4891f
  Jiarui Fang authored Mar 10, 2022
```
* place params on cpu after zero init context

* polish code
```
  44e4891f
- [zero] global model data memory tracer (#360) · ea287207
  Jiarui Fang authored Mar 10, 2022
  
  ea287207
- [test] polish zero related unitest (#351) · cb34cd38
  Jiarui Fang authored Mar 10, 2022
  
  cb34cd38
- add test sharded optim with cpu adam (#347) · 532ae79c
  ver217 authored Mar 09, 2022
  
  532ae79c
- [zero] update sharded optim v2 (#334) · d0ae0f22
  ver217 authored Mar 09, 2022
  
  d0ae0f22
- fix bert unit test · f5f0ad26
  ver217 authored Mar 09, 2022
  
  f5f0ad26
- polish engine unitest · d271f259
  jiaruifang authored Mar 09, 2022
  
  d271f259
- polish code · 354c0f90
  jiaruifang authored Mar 09, 2022
  
  354c0f90
- adapting bert unitest interface · 4d94cd51
  jiaruifang authored Mar 09, 2022
  
  4d94cd51
- add bert for unitest and sharded model is not able to pass the bert case · 7977422a
  jiaruifang authored Mar 09, 2022
  
  7977422a
- [zero] Update sharded model v2 using sharded param v2 (#323) · 13886716
  ver217 authored Mar 08, 2022
  
  13886716
- using pytest parametrize · 799d105b
  jiaruifang authored Mar 08, 2022
  
  799d105b
- show pytest parameterize · dec24561
  jiaruifang authored Mar 08, 2022
  
  dec24561
- [zero] update zero context init with the updated test utils (#327) · 11bddb6e
  Jiarui Fang authored Mar 08, 2022
  
  11bddb6e
- [zero] zero init context (#321) · de0468c7
  Jiarui Fang authored Mar 07, 2022
```
* add zero init context

* add more flags for zero init context
fix bug of repeated converting param to ShardedParamV2

* polish code
```
  de0468c7
- [zero] yet an improved sharded param (#311) · 90d3aef6
  Jiarui Fang authored Mar 04, 2022
  
  90d3aef6
- [zero] polish shard strategy (#310) · c9e7d958
  Jiarui Fang authored Mar 04, 2022
```
* init shard param from shape tuple

* add more unitest for shard param

* add set_payload method for ShardedParam

* [zero] add shareded tensor class

* polish code

* add shard stratgy

* move shard and gather logic to shard strategy from shard tensor.

* polish code
```
  c9e7d958
- fix sharded param hook and unit test · 36f9a74a
  ver217 authored Mar 04, 2022
  
  36f9a74a
- impl shard optim v2 and add unit test · 001ca624
  ver217 authored Mar 04, 2022
  
  001ca624
- [zero] a shard strategy in granularity of tensor (#307) · 74f77e31
  Jiarui Fang authored Mar 04, 2022
  
  74f77e31
- [zero] sharded tensor (#305) · 80364c76
  Jiarui Fang authored Mar 04, 2022
```
* init shard param from shape tuple

* add more unitest for shard param

* add set_payload method for ShardedParam

* [zero] add shareded tensor class

* polish code
```
  80364c76
- Polish sharded parameter (#297) · e17e92c5
  Jiarui Fang authored Mar 03, 2022
```
* init shard param from shape tuple

* add more unitest for shard param

* add more unittests to shareded param
```
  e17e92c5
- [zero] add sharded grad and refactor grad hooks for ShardedModel (#287) · 7aef75ca
  ver217 authored Mar 02, 2022
  
  7aef75ca
- added unit test for sharded optimizer (#293) · 27155b85
  Frank Lee authored Mar 02, 2022
```
* added unit test for sharded optimizer

* refactor for elegance
```
  27155b85
- added buffer sync to naive amp model wrapper (#291) · e17e54e3
  Frank Lee authored Mar 02, 2022
  
  e17e54e3
- Feature/zero (#279) · 5a560a06
  Jiarui Fang authored Mar 01, 2022
```
* add zero1 (#209)

* add zero1

* add test zero1

* update zero stage 1 develop (#212)

* Implement naive zero3 (#240)

* naive zero3 works well

* add zero3 param manager

* add TODOs in comments

* add gather full param ctx

* fix sub module streams

* add offload

* fix bugs of hook and add unit tests

* fix bugs of hook and add unit tests (#252)

* add gather full param ctx

* fix sub module streams

* add offload

* fix bugs of hook and add unit tests

* polish code and add state dict hook

* fix bug

* update unit test

* refactor reconstructed zero code

* clip_grad support zero3 and add unit test

* add unit test for Zero3ParameterManager

* [WIP] initialize the shard param class

* [WIP] Yet another sharded model implementation (#274)

* [WIP] initialize the shard param class

* [WIP] Yes another implementation of shardModel. Using a better hook method.

* torch.concat -> torch.cat

* fix test_zero_level_1.py::test_zero_level_1 unitest

* remove deepspeed implementation and refactor for the reconstructed zero module

* polish zero dp unittests
Co-authored-by: ver217 <lhx0217@gmail.com>
Co-authored-by: Frank Lee <somerlee.9@gmail.com>
```
  5a560a06