搜索"DeepSeek"的结果

共找到9个相关文章

DeepSeek更新上下文达百万级token:可一次性处理超长文本

发布时间:2026-02-12 浏览:13
DeepSeek网页端与APP同步升级,上下文窗口由128K扩至1M Token,容量提升八倍,可一次读完《三体》三部曲;模型知识截止日已推进到2025年5月,对2024下半年至2025年初信息具备认知。

开源界的扛把子 一大波国产AI在路上:欧美却被专家吐槽

发布时间:2026-01-27 浏览:82
春节前三周,国产开源AI密集升级:DeepSeek V4将决定开源能否追上谷歌、OpenAI、Anthropic;智谱已发GLM 4.7 Air,月之暗面内测Kimi K2.1/2.5,MiniMax海外官宣MiniMax 2.2,或继续强化编程能力;MiniMax 2.1驱动的Clawdbot在Github获3万星。海外评价称国产开源进展令欧美闭源阵营失色。

新一代旗舰级人工智能模型!曝DeepSeekV4春节前后发布

发布时间:2026-01-10 浏览:66
深度求索(DeepSeek)预计2月中旬农历新年前后发布代号V4的新一代旗舰AI模型,主打百万级tokens超长上下文代码生成,可一次性解析中型项目完整代码库、文档与需求,解决跨文件依赖断裂。内部基准测试显示,其代码生成表现优于Anthropic Claude、OpenAI GPT系列。V4训练全程数据模式理解无衰减,形成抽象能力;或采用全新mHC架构,提升并行效率与国产芯片适配,降低部署成本。1

26年春节又热闹了 新论文暗示DeepSeek V4已完成训练

发布时间:2026-01-02 浏览:91
DeepSeek在2026年元旦假期发布论文,提出“流形约束超连接”框架,解决HC放大倍数过高导致训练崩溃的问题:27B参数模型下,mHC把放大倍数从约3000降至1.6,训练时间仅增6.7%,复杂推理、阅读理解任务准确率分别提升7.2、6.9个百分点。论文暗示已完成新一代基座模型DeepSeek V4训练,预计2月初发布,将支持FP8算子、国产AI芯片及多模态;是否再推R2推理模型未定。

“2025年度字词”即将出炉:DeepSeek、草台班子入选

发布时间:2025-12-11 浏览:76
“汉语盘点2025”日前公布年度字词候选前五:国内字“韧、创、融、智、通”,国内词“十五五、深度求索(DeepSeek)、九三阅兵、苏超、具身智能”;国际字“税、抢、界、谈、硬”,国际词“地缘政治、无人机、稀土、草台班子、关税”。活动由国家语言资源监测与研究中心、商务印书馆、新华网等主办,11月20日启动,12月19日将揭晓最终年度字词。

腾讯双模型首发:混元2.0与DeepSeek V3.2同步上线,应用与API全面开放

发布时间:2025-12-05 浏览:152
腾讯正式发布自研大模型混元2.0,并同步接入DeepSeek V3.2。两大先进模型已率先在元宝、ima等原生应用上线,提供深度思考与高效响应双重体验。同时,腾讯云全面开放模型API与开发平台,助力企业与开发者快速集成最新AI能力。

DeepSeek-V3.2正式发布:推理能力全球领先,思考融入工具调用开启智能新纪元

发布时间:2025-12-01 浏览:109
DeepSeek正式发布V3.2和V3.2-Speciale模型,在推理能力上达到全球领先水平,首次实现思考模式下的工具调用,大幅提升智能体任务表现,模型已全面开源并提供API服务。

DeepSeek(大模型)

发布时间:2025-11-24 浏览:114
DeepSeek是由杭州深度求索人工智能基础技术研究有限公司研发的一系列开源大语言模型,以稀疏激活混合专家(MoE)架构和低精度训练技术为特色,通过创新的推理优化大幅降低算力需求,推动AI技术普惠化发展。

DeepSeek-V3.2-Exp 发布,训练推理提效,API 降价大降50%以上

发布时间:2025-10-01 浏览:202
今天,我们正式发布 DeepSeek-V3.2-Exp 模型,这是一个实验性(Experimental)的版本。作为迈向新一代架构的中间步骤,V3.2-Exp 在 V3.1-Terminus 的基础上引入了 DeepSeek Sparse Attention(一种稀疏注意力机制),针对长文本的训练和推理效率进行了探索性的优化和验证。