健康

阿裏發布並开源千問3 成本僅需DeepSeek-R1三分之一

2025-04-29 20:24:59

Robot

健康

從阿裏雲獲悉，4月29日凌晨，阿裏巴巴开源新一代通義千問模型Qwen3（簡稱千問3），參數量僅爲DeepSeek-R1的1/3，成本大幅下降，性能全面超越R1、OpenAI-o1等全球頂尖模型，登頂全球最強开源模型。

千問3是國內首個“混合推理模型”，“快思考”與“慢思考”集成進同一個模型，對簡單需求可低算力“秒回”答案，對復雜問題可多步驟“深度思考”，大大節省算力消耗。

遊民星空

千問3採用混合專家（MoE）架構，總參數量235B，激活僅需22B。千問3預訓練數據量達36T ，並在後訓練階段多輪強化學習，將非思考模式無縫整合到思考模型中。千問3在推理、指令遵循、工具調用、多語言能力等方面均大幅增強，即創下所有國產模型及全球开源模型的性能新高：在奧數水平的AIME25測評中，千問3斬獲81.5分，刷新开源紀錄；在考察代碼能力的LiveCodeBench評測中，千問3突破70分大關，表現甚至超過Grok3；在評估模型人類偏好對齊的ArenaHard測評中，千問3以95.6分超越OpenAI-o1及DeepSeek-R1。

性能大幅提升的同時，千問3的部署成本還大幅下降，僅需4張H20即可部署千問3滿血版，顯存佔用僅爲性能相近模型的三分之一。

標題：阿裏發布並开源千問3 成本僅需DeepSeek-R1三分之一

地址：https://www.newsipad.com/article/198810.html

阿裏發布並开源千問3 成本僅需DeepSeek-R1三分之一

相關推薦

Steam廢土風幸存者《炮艦外交》正式參加2025MGN遊戲節！

《光與影：33號遠徵隊》官方推薦玩回合制RPG《百日战紀 最終防衛學園》：太優秀了！

洋鬼片可能會看出一身汗，但中式恐怖才配讓我換褲子

拳拳到肉！Steam格鬥類肉鴿遊戲《虐殺熔爐》首發好評折扣中！

奧斯卡須看完所有提名影片才投票？網友：naive 讓中國人教你

首曝RTX5060移動版Geekbench跑分！比4060高18%

《光與影：33號遠徵隊》官方推薦玩回合制RPG《百日战紀最終防衛學園》：太優秀了！