wan model cpu_offload (#3)
* 修改了main.py, t5的model, wan的model、三个weights文件和三个infer文件, 并且在common的conv3d算子中注册新算子 * 修改了Conv3dWeightForceBF16算子,更新了wan的pre_weights中对此算子的使用 * 修复了import中的bug * 修复了WanPreWeights, WanTransformerWeights没有self.config的bug * 修复了WanPreWeights, WanTransformerWeights没有self.config的bug * 修复了config的bug,目前在使用cpu_offload的时候,vae阶段有tensor不在同一device的bug * 修复了vae阶段迁移的bug * 修复了scale在mean和inv_std迁移后仍需重新赋值的bug
Showing
Please register or sign in to comment