搜索"SuperCLUE"的结果
共找到1个相关文章
Gemini 3中文测评结果发布:首超GPT-5 全球第二 AI资讯
SuperCLUE 9月中文大模型基准测评显示,谷歌Gemini-3-Pro-Preview以70.80分位列全球第二,领先GPT-5(high) 1.43分,落后GPT-5.1(high) 1.71分;Gemini-2.5-Pro居第七。新模型推理效率微升至31.9秒/题,成本升至32.0元/百万Tokens。测评覆盖数学推理、科学推理、代码生成、智能体Agent、幻觉控制、精确指令遵循六维度,
共 1 条1