一次可处理100个文件!千问“任务助理”开启邀测
1月15日,千问“任务助理”在App与Web端启动定向邀测,支持应用开发、Office办公、咨询调研、生活办事等场景,可自动规划并执行多步骤复杂任务,如报表整理、汇报材料优化、调研报告生成、小工具按需创建。为降低大模型幻觉,App内置“双重核查”,允许调用第三方agent复核关键数据或结论。Web端最多并行处理100个文件,App端10个;整理异形Excel、批量发offer、跨网页收集并分析舆情
1月15日,千问“任务助理”在App与Web端启动定向邀测,支持应用开发、Office办公、咨询调研、生活办事等场景,可自动规划并执行多步骤复杂任务,如报表整理、汇报材料优化、调研报告生成、小工具按需创建。为降低大模型幻觉,App内置“双重核查”,允许调用第三方agent复核关键数据或结论。Web端最多并行处理100个文件,App端10个;整理异形Excel、批量发offer、跨网页收集并分析舆情
千问APP近日上线教育功能,用户一句话指令即可获取期末真题及解析。期末复习高峰带动学习相关能力调用量周环比增超100%,找真题需求5天内涨300%。平台紧急推出六大学习能力,新增“举一反三精准练”可据错题生成个性化练习册,并收录超千万条免费真人老师讲解视频。
深度求索(DeepSeek)预计2月中旬农历新年前后发布代号V4的新一代旗舰AI模型,主打百万级tokens超长上下文代码生成,可一次性解析中型项目完整代码库、文档与需求,解决跨文件依赖断裂。内部基准测试显示,其代码生成表现优于Anthropic Claude、OpenAI GPT系列。V4训练全程数据模式理解无衰减,形成抽象能力;或采用全新mHC架构,提升并行效率与国产芯片适配,降低部署成本。1
千问App公众号发布“找期末卷真题、求解析”攻略:题库已收录数亿道题,仍在扩容;用户一句指令即可搜索并下载PDF、Word试卷,也可语音获取带举一反三的真人老师讲解视频,讲解视频超千万条且全部免费。
DeepSeek在2026年元旦假期发布论文,提出“流形约束超连接”框架,解决HC放大倍数过高导致训练崩溃的问题:27B参数模型下,mHC把放大倍数从约3000降至1.6,训练时间仅增6.7%,复杂推理、阅读理解任务准确率分别提升7.2、6.9个百分点。论文暗示已完成新一代基座模型DeepSeek V4训练,预计2月初发布,将支持FP8算子、国产AI芯片及多模态;是否再推R2推理模型未定。
SuperCLUE-VLM 12月多模态视觉语言基准测评发布:谷歌Gemini-3-pro以83.64分夺冠,基础认知89.01、视觉推理82.82、视觉应用79.09三项指标均领先。国内阵营中,商汤SenseNova V6.5 Pro 75.35分列第二,字节跳动豆包视觉版73.15分获第三,其基础认知82.70超部分国际竞品;百度ERNIE-5.0-Preview、阿里开源Qwen3-vl亦进
12月22日,阿里开源图像生成模型Qwen-Image-Layered,首次内置PS级图层理解与生成。模型采用自研RGBA-VAE编码和VLD-MMDiT架构,引入Alpha通道与图层级3D位置编码,可将图片拆分为多层并自动补全遮挡背景,实现“零漂移”精准编辑,解决AI生图一致性难题。训练数据取自海量真实PSD文件,使AI具备专业分层思维。模型已在魔搭社区和HuggingFace开源,可免下载商用
千问App发布“2025十大AI提示词”榜单,股票、八字、情感咨询位列用户提问前三,其余高频提示词包括朋友圈文案、景点推荐、双色球号码、失眠、解答这道题、离婚财产分割、人生的意义。榜单显示用户将AI视为多元伙伴而非单一工具。公测23天,千问全端月活超3000万,成全球增速最快AI应用之一;其已上线AI PPT、写作、文库、讲题四项功能,并正接入地图、外卖、订票、办公、学习、购物、健康等场景。
钉钉被传内部推进代号为“D计划”的保密项目,供应链消息称其可能推出类似“豆包手机”的AI硬件。公司已预告12月23日举办AI 1.1版本发布会,外界猜测“D计划”或成发布核心。钉钉官方仅承认听闻“豆包手机”,对“D计划”表示“没听说”,并强调部分创新项目保密等级极高。
Google发布轻量模型Gemini 3 Flash,响应速度为前代三倍,几近“零延迟”。SWE-bench得分78%,首次超越Gemini 3 Pro的76.2%;GPQA Diamond 90.4%、Humanity’s Last Exam无工具33.7%,多基准优于Gemini 2.5 Pro,LMArena文本能力排名第三。