阿里推出全新推理模子：仅1/21参数忘形DeepSeek R1

栏目分类

热点资讯

配资开户你的位置：凯丰策略 > 配资开户 > 阿里推出全新推理模子：仅1/21参数忘形DeepSeek R1

发布日期：2025-03-06 09:28 点击次数：86

快科技3月6日音问，阿里Qwen团队厚爱发布他们最新的征询遵守——QwQ-32B大道话模子。

这是一款领有320亿参数的模子，其性能可与具备6710亿参数（其中370亿被激活）的DeepSeek-R1忘形。

QwQ-32B在仅有DeepSeek-R1约1/21参数目的情况下，用强化学习竣事了性能上的越过。

此外，阿里还在推理模子中集成了与Agent关系的才能，使其豪爽在使用器具的同期进行批判性想考，并阐述环境反映调度推理历程。

阿里推出全新推理模子：仅1/21参数忘形DeepSeek R1

QwQ-32B 在一系列基准测试中进行了评估，测试了数学推理、编程才能和通用才能。

其中，在测试数学才能的AIME24评测集上，凯丰策略以及评估代码才能的LiveCodeBench中，千问QwQ-32B发达与DeepSeek-R1非常，远胜于o1-mini及疏导尺寸的R1 蒸馏模子。

同期，在由Meta首席科学家杨立昆领衔的“最难LLMs评测榜”LiveBench、谷歌等建议的教唆遵照才能IFEval评测集、由加州大学伯克利分校等建议的评估准确调用函数或器具方面的BFCL测试中，千问QwQ-32B的得分均杰出了DeepSeek- R1。

当今，QwQ-32B已在Hugging Face和ModelScope开源，各人也可通过Qwen Chat径直进行体验！

遭殃剪辑：随性98配资官网