论文 #
https://github.com/QwenLM/Qwen3/
Arch [2] #

Compare [1] #

Post-training #

阶段三:思考模式融合 #
**两种模式使用/think和/no_think标志进行区分,**注意“非思考模式”也有开始
参考 #
Qwen3技术报告的几点细节、ArXiv论文翻译实现方案及试错历程
up: 卢老师, 怀中猫
https://github.com/QwenLM/Qwen3/



**两种模式使用/think和/no_think标志进行区分,**注意“非思考模式”也有开始
Qwen3技术报告的几点细节、ArXiv论文翻译实现方案及试错历程
up: 卢老师, 怀中猫