Commits · a9c27be42e1cba258c9aabc0366e7c5cdf4a5342 · OpenDAS / ColossalAI

14 Mar, 2022 2 commits
- Added tensor detector (#393) · a9c27be4
  LuGY authored Mar 14, 2022
```
* Added tensor detector

* Added the - states

* Allowed change include_cpu when detect()
```
  a9c27be4
- polish unit test · 54fd37f0
  ver217 authored Mar 14, 2022
  
  54fd37f0
11 Mar, 2022 38 commits
- fixed bug in activation checkpointing test (#387) · 1e4bf85c
  Frank Lee authored Mar 11, 2022
  
  1e4bf85c
- [zero] polish ShardedOptimV2 unittest (#385) · 3af13a2c
  Jiarui Fang authored Mar 11, 2022
```
* place params on cpu after zero init context

* polish code

* bucketzed cpu gpu tensor transter

* find a bug in sharded optim unittest

* add offload unittest for ShardedOptimV2.

* polish code and make it more robust
```
  3af13a2c
- [unit test] Refactored test cases with component func (#339) · 526a3180
  Frank Lee authored Mar 11, 2022
```
* refactored test with component func

* fixed bug
```
  526a3180
- Added activation offload (#331) · de464504
  LuGY authored Mar 11, 2022
```
* Added activation offload

* Fixed the import bug, used the pytest
```
  de464504
- [zero] find miss code (#378) · b5f43ace
  Jiarui Fang authored Mar 10, 2022
  
  b5f43ace
- [zero] zero init context collect numel of model (#375) · 6b600296
  Jiarui Fang authored Mar 10, 2022
  
  6b600296
- Revert "[zero] bucketized tensor cpu gpu copy (#368)" · d9217e19
  jiaruifang authored Mar 10, 2022
```
This reverts commit bef05489b642385c80e59fe757d598efd1752ecf.
```
  d9217e19
- [zero] bucketized tensor cpu gpu copy (#368) · 00670c87
  Jiarui Fang authored Mar 10, 2022
  
  00670c87
- [zero] able to place params on cpu after zero init context (#365) · 44e4891f
  Jiarui Fang authored Mar 10, 2022
```
* place params on cpu after zero init context

* polish code
```
  44e4891f
- [zero] global model data memory tracer (#360) · ea287207
  Jiarui Fang authored Mar 10, 2022
  
  ea287207
- [test] polish zero related unitest (#351) · cb34cd38
  Jiarui Fang authored Mar 10, 2022
  
  cb34cd38
- add test sharded optim with cpu adam (#347) · 532ae79c
  ver217 authored Mar 09, 2022
  
  532ae79c
- Added Profiler Context to manage all profilers (#340) · 425bb0df
  HELSON authored Mar 09, 2022
  
  425bb0df
- [zero] update sharded optim v2 (#334) · d0ae0f22
  ver217 authored Mar 09, 2022
  
  d0ae0f22
- skip bert in test engine · 2b8cddd4
  ver217 authored Mar 09, 2022
  
  2b8cddd4
- fix bert unit test · f5f0ad26
  ver217 authored Mar 09, 2022
  
  f5f0ad26
- polish engine unitest · d271f259
  jiaruifang authored Mar 09, 2022
  
  d271f259
- polish code · 354c0f90
  jiaruifang authored Mar 09, 2022
  
  354c0f90
- adapting bert unitest interface · 4d94cd51
  jiaruifang authored Mar 09, 2022
  
  4d94cd51
- add bert for unitest and sharded model is not able to pass the bert case · 7977422a
  jiaruifang authored Mar 09, 2022
  
  7977422a
- [zero] Update sharded model v2 using sharded param v2 (#323) · 13886716
  ver217 authored Mar 08, 2022
  
  13886716
- using pytest parametrize · 799d105b
  jiaruifang authored Mar 08, 2022
  
  799d105b
- show pytest parameterize · dec24561
  jiaruifang authored Mar 08, 2022
  
  dec24561
- [zero] update zero context init with the updated test utils (#327) · 11bddb6e
  Jiarui Fang authored Mar 08, 2022
  
  11bddb6e
- [test] refactored testing components (#324) · 6268446b
  Frank Lee authored Mar 08, 2022
  
  6268446b
- [zero] zero init context (#321) · de0468c7
  Jiarui Fang authored Mar 07, 2022
```
* add zero init context

* add more flags for zero init context
fix bug of repeated converting param to ShardedParamV2

* polish code
```
  de0468c7
- Added profiler communication operations · 73bff112
  1SAA authored Mar 04, 2022
```
Fixed bug for learning rate scheduler
```
  73bff112
- [zero] cpu adam kernel (#288) · a3269de5
  LuGY authored Mar 04, 2022
```
* Added CPU Adam

* finished the cpu adam

* updated the license

* delete useless parameters, removed resnet

* modified the method off cpu adam unittest

* deleted some useless codes

* removed useless codes
Co-authored-by: ver217 <lhx0217@gmail.com>
Co-authored-by: Frank Lee <somerlee.9@gmail.com>
Co-authored-by: jiaruifang <fangjiarui123@gmail.com>
```
  a3269de5
- [zero] yet an improved sharded param (#311) · 90d3aef6
  Jiarui Fang authored Mar 04, 2022
  
  90d3aef6
- [zero] polish shard strategy (#310) · c9e7d958
  Jiarui Fang authored Mar 04, 2022
```
* init shard param from shape tuple

* add more unitest for shard param

* add set_payload method for ShardedParam

* [zero] add shareded tensor class

* polish code

* add shard stratgy

* move shard and gather logic to shard strategy from shard tensor.

* polish code
```
  c9e7d958
- fix sharded param hook and unit test · 36f9a74a
  ver217 authored Mar 04, 2022
  
  36f9a74a
- impl shard optim v2 and add unit test · 001ca624
  ver217 authored Mar 04, 2022
  
  001ca624
- [zero] a shard strategy in granularity of tensor (#307) · 74f77e31
  Jiarui Fang authored Mar 04, 2022
  
  74f77e31
- [zero] sharded tensor (#305) · 80364c76
  Jiarui Fang authored Mar 04, 2022
```
* init shard param from shape tuple

* add more unitest for shard param

* add set_payload method for ShardedParam

* [zero] add shareded tensor class

* polish code
```
  80364c76
- [profiler] primary memory tracer · d3446892
  Jie Zhu authored Mar 04, 2022
  
  d3446892
- Polish sharded parameter (#297) · e17e92c5
  Jiarui Fang authored Mar 03, 2022
```
* init shard param from shape tuple

* add more unitest for shard param

* add more unittests to shareded param
```
  e17e92c5
- [zero] add sharded grad and refactor grad hooks for ShardedModel (#287) · 7aef75ca
  ver217 authored Mar 02, 2022
  
  7aef75ca
- added unit test for sharded optimizer (#293) · 27155b85
  Frank Lee authored Mar 02, 2022
```
* added unit test for sharded optimizer

* refactor for elegance
```
  27155b85