AI资讯 - 维度狐

11月25日，Anthropic发布并商用旗舰模型Claude Opus 4.5。官方称该模型在编码、智能代理及办公场景中性能领先，为两个月内连续推出的第三款模型。SWE-bench测试显示，其编程得分高于Gemini 3 Pro与GPT-5.1，并在软件工程师闭卷测试中超越全部历史人类考生。Opus 4.5已集成至Pro、Max、Enterprise产品线，同步上线Chrome扩展、Excel插

2025-11-25

Gemini 3中文测评结果发布：首超GPT-5 全球第二

SuperCLUE 9月中文大模型基准测评显示，谷歌Gemini-3-Pro-Preview以70.80分位列全球第二，领先GPT-5(high) 1.43分，落后GPT-5.1(high) 1.71分；Gemini-2.5-Pro居第七。新模型推理效率微升至31.9秒/题，成本升至32.0元/百万Tokens。测评覆盖数学推理、科学推理、代码生成、智能体Agent、幻觉控制、精确指令遵循六维度，

2025-11-19

30秒生成应用的AI助手来了！蚂蚁集团灵光App正式上线

蚂蚁集团11月18日发布全模态通用AI助手“灵光”，可在移动端30秒自然语言生成可编辑、可交互、可分享的小应用，并首次实现全代码生成多模态内容。首批上线“灵光对话”“灵光闪应用”“灵光开眼”三大功能，支持3D、音视频、图表、动画、地图等全模态输出，已同步登陆安卓与苹果应用商店。“灵光对话”以结构化思维生成可视化内容；“灵光闪应用”一句话秒级生成带后端能力的个性化AI应用；“灵光开眼”搭载AGI相机

2025-11-18

微软披露侧信道攻击：可窥探你和AI聊天内容

据媒体报道，微软安全研究团队近日披露了一项名为“Whisper Leak”的高风险隐私漏洞，该漏洞针对现代AI聊天服务，构成一种新型侧信道攻击。

2025-11-10