從阿裏雲獲悉,4月29日凌晨,阿裏巴巴开源新一代通義千問模型Qwen3(簡稱千問3),參數量僅爲DeepSeek-R1的1/3,成本大幅下降,性能全面超越R1、OpenAI-o1等全球頂尖模型,登頂全球最強开源模型。
千問3是國內首個“混合推理模型”,“快思考”與“慢思考”集成進同一個模型,對簡單需求可低算力“秒回”答案,對復雜問題可多步驟“深度思考”,大大節省算力消耗。
千問3採用混合專家(MoE)架構,總參數量235B,激活僅需22B。千問3預訓練數據量達36T ,並在後訓練階段多輪強化學習,將非思考模式無縫整合到思考模型中。千問3在推理、指令遵循、工具調用、多語言能力等方面均大幅增強,即創下所有國產模型及全球开源模型的性能新高:在奧數水平的AIME25測評中,千問3斬獲81.5分,刷新开源紀錄;在考察代碼能力的LiveCodeBench評測中,千問3突破70分大關,表現甚至超過Grok3;在評估模型人類偏好對齊的ArenaHard測評中,千問3以95.6分超越OpenAI-o1及DeepSeek-R1。
性能大幅提升的同時,千問3的部署成本還大幅下降,僅需4張H20即可部署千問3滿血版,顯存佔用僅爲性能相近模型的三分之一。
標題:阿裏發布並开源千問3 成本僅需DeepSeek-R1三分之一
地址:https://www.newsipad.com/article/198810.html