搜索"DeepSeek"的结果
共找到12个相关文章
DeepSeek(大模型) 百科
DeepSeek是由杭州深度求索人工智能基础技术研究有限公司研发的一系列开源大语言模型,以稀疏激活混合专家(MoE)架构和低精度训练技术为特色,通过创新的推理优化大幅降低算力需求,推动AI技术普惠化发展。
DeepSeek-V3.2-Exp 发布,训练推理提效,API 降价大降50%以上 AI资讯
今天,我们正式发布 DeepSeek-V3.2-Exp 模型,这是一个实验性(Experimental)的版本。作为迈向新一代架构的中间步骤,V3.2-Exp 在 V3.1-Terminus 的基础上引入了 DeepSeek Sparse Attention(一种稀疏注意力机制),针对长文本的训练和推理效率进行了探索性的优化和验证。