
发布日期:2025-03-06 09:28 点击次数:81
快科技3月6日音问,阿里Qwen团队厚爱发布他们最新的征询遵守——QwQ-32B大道话模子。
这是一款领有320亿参数的模子,其性能可与具备6710亿参数(其中370亿被激活)的DeepSeek-R1忘形。
QwQ-32B在仅有DeepSeek-R1约1/21参数目的情况下,用强化学习竣事了性能上的越过。
此外,阿里还在推理模子中集成了与Agent关系的才能,使其豪爽在使用器具的同期进行批判性想考,并阐述环境反映调度推理历程。
QwQ-32B 在一系列基准测试中进行了评估,测试了数学推理、编程才能和通用才能。
其中,在测试数学才能的AIME24评测集上,凯丰策略以及评估代码才能的LiveCodeBench中,千问QwQ-32B发达与DeepSeek-R1非常,远胜于o1-mini及疏导尺寸的R1 蒸馏模子。
同期,在由Meta首席科学家杨立昆领衔的“最难LLMs评测榜”LiveBench、谷歌等建议的教唆遵照才能IFEval评测集、由加州大学伯克利分校等建议的评估准确调用函数或器具方面的BFCL测试中,千问QwQ-32B的得分均杰出了DeepSeek- R1。
当今,QwQ-32B已在Hugging Face和ModelScope开源,各人也可通过Qwen Chat径直进行体验!
遭殃剪辑:随性98配资官网
Powered by 凯丰策略 @2013-2022 RSS地图 HTML地图
建站@kebiseo; 2013-2024 北京万生私募基金管理有限公司 版权所有