5月28日,权威大模型测评机构SuperCLUE《中文大模型基准测评2025年5月汇报》全新出炉!
豆包1.5·深度思索模型(Doubao-1.5-thinking-pro)和商汤日日新 V6多模态模型(SenseNova-V6 Reasoner)一同摘得金牌,超越Gemini 2.5 Flash Preview,在国内大模型第一梯队领跑。
位居第二梯队的大模型包含DeepSeek-R1、NebulaCoder-V6、Hunyuan-T1另有DeepSeek-V3。

来自SuperCLUE
汇报指出,国内外第一梯队大模型在中文领域的通用实力差距正在缩小。在国产大模型中,Doubao-1.5-thinking-pro-250415、SenseNova V6 Reasoner体现最为亮眼。国内推理模型角逐格局初露端倪。
SuperCLUE是产业权威的通用大模型的综合性测评基准。本次2025年5月汇报聚焦通用实力测评,涵盖数学推理、科学推理、代码生成、智能体Agent、精确指令遵循、文本领会与创作六大任务,总量为1579道多轮简答题。
顶: 211踩: 9
最新一期权威大模型榜单:豆包1.5、商汤日日新V6并列国内第一
人参与 | 时间:2025-12-08 00:14:12
相关文章
- 探路者推出第二代外骨骼:户外科技与芯片生态双向赋能
- 羊绒服饰花费将有国家级量化标准,标准由印象草原负责拟定!
- 国际进口花卉博览会论坛及贸易展在沪开幕
- 立冬开启 “补冬形式”,思乐得焖烧锅轻松焖好羊肉汤,暖身更暖心
- 兰宝3D激光线扫传感器:为新能源汽车碰撞电源生产给予胶体检测的‘火眼金睛’
- 守护“囍”字招牌丨双喜电器再赢商标保卫战
- 挑战低功耗极限!杭州研极微发布「研极芯Gen2」以业界1/10功耗树立续航新标杆
- 京东11.11 PLUS会员福利加磅 开卡享积分翻倍 可兑换家政、洗衣、洗车等权益
- 探路者加码半导体与端侧AI赛道 双收购彰显端侧AI战略雄心
- 复购率超普通产品3倍,“无抗”食品为何俘获花费者芳心?






评论专区