我在使用7b训练时显存溢出,继而选择了3b模型进行训练,在4卡训练时,报错RuntimeError: CUDA error: HIPBLAS_STATUS_ALLOC_FAILED when calling hipblasCreate(handle),完整日志如下 log.log
hipblasCreate(handle)