搜索"SuperCLUE"的结果

共找到1个相关文章

Gemini 3中文测评结果发布:首超GPT-5 全球第二

发布时间:2025-11-19 浏览:115
SuperCLUE 9月中文大模型基准测评显示,谷歌Gemini-3-Pro-Preview以70.80分位列全球第二,领先GPT-5(high) 1.43分,落后GPT-5.1(high) 1.71分;Gemini-2.5-Pro居第七。新模型推理效率微升至31.9秒/题,成本升至32.0元/百万Tokens。测评覆盖数学推理、科学推理、代码生成、智能体Agent、幻觉控制、精确指令遵循六维度,