搜索"大模型"的结果
共找到15个相关文章
DeepSeek更新上下文达百万级token:可一次性处理超长文本 AI资讯
DeepSeek网页端与APP同步升级,上下文窗口由128K扩至1M Token,容量提升八倍,可一次读完《三体》三部曲;模型知识截止日已推进到2025年5月,对2024下半年至2025年初信息具备认知。
新一代旗舰级人工智能模型!曝DeepSeekV4春节前后发布 AI资讯
深度求索(DeepSeek)预计2月中旬农历新年前后发布代号V4的新一代旗舰AI模型,主打百万级tokens超长上下文代码生成,可一次性解析中型项目完整代码库、文档与需求,解决跨文件依赖断裂。内部基准测试显示,其代码生成表现优于Anthropic Claude、OpenAI GPT系列。V4训练全程数据模式理解无衰减,形成抽象能力;或采用全新mHC架构,提升并行效率与国产芯片适配,降低部署成本。1
26年春节又热闹了 新论文暗示DeepSeek V4已完成训练 AI资讯
DeepSeek在2026年元旦假期发布论文,提出“流形约束超连接”框架,解决HC放大倍数过高导致训练崩溃的问题:27B参数模型下,mHC把放大倍数从约3000降至1.6,训练时间仅增6.7%,复杂推理、阅读理解任务准确率分别提升7.2、6.9个百分点。论文暗示已完成新一代基座模型DeepSeek V4训练,预计2月初发布,将支持FP8算子、国产AI芯片及多模态;是否再推R2推理模型未定。
大模型视觉测评榜单出炉:Gemini遥遥领先 豆包冲进前三 AI资讯
SuperCLUE-VLM 12月多模态视觉语言基准测评发布:谷歌Gemini-3-pro以83.64分夺冠,基础认知89.01、视觉推理82.82、视觉应用79.09三项指标均领先。国内阵营中,商汤SenseNova V6.5 Pro 75.35分列第二,字节跳动豆包视觉版73.15分获第三,其基础认知82.70超部分国际竞品;百度ERNIE-5.0-Preview、阿里开源Qwen3-vl亦进
文心(大模型) 百科
文心大模型(英文名:ERNIE,Enhanced Representation through kNowledge IntEgration),是百度公司自主研发的产业级知识增强大模型系列。它不仅是一个单一的AI模型,更是一个持续演进、赋能千行百业的技术家族与智能化基座。文心大模型以其全栈自主的技术体系、强大的多模态理解与生成能力,以及在产业中的深度融合应用,成为中国人工智能领域的核心代表之一。
世界首个!我国发布原生电力大模型:35毫秒即可实时输出关键指标 综合资讯
12月19日,北京怀柔国家实验室发布世界首个原生电力专业大模型NWHR电力生产大模型,实现量测数据、物理规律、运行规程三大核心突破:35毫秒内完成电网状态推演;把电网物理定律转为AI函数集,确保计算决策满足安全要求;异构空间语义对齐模块将风险评估准确率提升三倍。模型已在南方电网云南大理供电局示范运行,为高比例新能源并网及分布式新能源“即插即用”提供系统级方案。
腾讯双模型首发:混元2.0与DeepSeek V3.2同步上线,应用与API全面开放 AI资讯
腾讯正式发布自研大模型混元2.0,并同步接入DeepSeek V3.2。两大先进模型已率先在元宝、ima等原生应用上线,提供深度思考与高效响应双重体验。同时,腾讯云全面开放模型API与开发平台,助力企业与开发者快速集成最新AI能力。
可灵AI(大模型) 百科
可灵AI(Kling AI)是由中国科技公司快手开发并持续进化的人工智能视频与图像生成平台。在AI内容创作浪潮中,可灵AI致力于打造成为“AI时代的视频创作新基础设施”。2025年12月2日,其重磅发布的“可灵O1模型”引起了广泛关注,该模型被官方定位为全球首个大一统的多模态视频创作模型,标志着其在技术和应用生态上进入了一个全新阶段。
GPT5被曝换皮GPT4o 模型训练两年半原地踏步 AI资讯
据媒体报道,自GPT-4o发布以来,OpenAI的核心团队尚未开展任何针对下一代前沿模型的大规模预训练。
通义千问(Qwen):阿里云打造的全球领先大模型 百科
本文全面介绍阿里云推出的通义千问(Qwen)大模型系列,涵盖其从2023年正式发布至今的发展历程、创新的技术架构(如GQA、NTK感知插值)、卓越的性能表现、丰富的模型矩阵、繁荣的开源生态、广泛的行业应用场景以及未来的战略规划,展现其作为全球领先AI大模型的综合实力与影响力。