PS天塌了!阿里开源全新图像模型 可实现PS级图层
12月22日,阿里开源图像生成模型Qwen-Image-Layered,首次内置PS级图层理解与生成。模型采用自研RGBA-VAE编码和VLD-MMDiT架构,引入Alpha通道与图层级3D位置编码,可将图片拆分为多层并自动补全遮挡背景,实现“零漂移”精准编辑,解决AI生图一致性难题。训练数据取自海量真实PSD文件,使AI具备专业分层思维。模型已在魔搭社区和HuggingFace开源,可免下载商用
12月22日,阿里开源图像生成模型Qwen-Image-Layered,首次内置PS级图层理解与生成。模型采用自研RGBA-VAE编码和VLD-MMDiT架构,引入Alpha通道与图层级3D位置编码,可将图片拆分为多层并自动补全遮挡背景,实现“零漂移”精准编辑,解决AI生图一致性难题。训练数据取自海量真实PSD文件,使AI具备专业分层思维。模型已在魔搭社区和HuggingFace开源,可免下载商用
千问App发布“2025十大AI提示词”榜单,股票、八字、情感咨询位列用户提问前三,其余高频提示词包括朋友圈文案、景点推荐、双色球号码、失眠、解答这道题、离婚财产分割、人生的意义。榜单显示用户将AI视为多元伙伴而非单一工具。公测23天,千问全端月活超3000万,成全球增速最快AI应用之一;其已上线AI PPT、写作、文库、讲题四项功能,并正接入地图、外卖、订票、办公、学习、购物、健康等场景。
钉钉被传内部推进代号为“D计划”的保密项目,供应链消息称其可能推出类似“豆包手机”的AI硬件。公司已预告12月23日举办AI 1.1版本发布会,外界猜测“D计划”或成发布核心。钉钉官方仅承认听闻“豆包手机”,对“D计划”表示“没听说”,并强调部分创新项目保密等级极高。
Google发布轻量模型Gemini 3 Flash,响应速度为前代三倍,几近“零延迟”。SWE-bench得分78%,首次超越Gemini 3 Pro的76.2%;GPQA Diamond 90.4%、Humanity’s Last Exam无工具33.7%,多基准优于Gemini 2.5 Pro,LMArena文本能力排名第三。
12月12日凌晨,OpenAI发布GPT-5.2,付费端与API同步上线,距GPT-5.1不足一月。新模型分Instant、Thinking、Pro三版:Instant低延迟应对日常任务;Thinking主攻编程、长文档、数学等企业级复杂需求;Pro定位科研、金融等高难场景,号称能力天花板。
“豆包手机”最近引发关注,系统深度内嵌的AI助手已经可以帮用户进行复杂操作,包括点外卖、购买商品、打车等,都可以一句话实现。国内另一家AI公司智谱也不甘落后,深夜开源其核心AI Agent模型AutoGLM。
OpenAI拟于12月9日提前发布GPT 5.2,原定月底。12月1日,CEO山姆·奥特曼在内部备忘录中启动“红色警报”以加速改进ChatGPT。该版本被内部测试认定能力领先谷歌Gemini 3,但领先模型及测试方法未披露。GPT 5.0于8月7日推出,11月12日升级至5.1,因性能未达预期并伴随“接近AGI”宣传,成为OpenAI最受争议的一代。
腾讯正式发布自研大模型混元2.0,并同步接入DeepSeek V3.2。两大先进模型已率先在元宝、ima等原生应用上线,提供深度思考与高效响应双重体验。同时,腾讯云全面开放模型API与开发平台,助力企业与开发者快速集成最新AI能力。
《商业内幕》(Business Insider)报道,哈佛大学青年民调(Harvard Youth Poll)最新发布的一项调查显示,大量美国年轻人对人工智能(AI)可能影响自身未来表示担忧。
OpenAI的人工智能助手ChatGPT于12月2日至3日连续出现服务中断,导致部分用户无法正常使用。