A

axolotl-Qwen3-4B_pytorch

同时具备Distil+SFT+RL的方法开源,人工智能大厂所用的主流后训练方法所有人都可以轻松拥有。