找回密码
 立即注册
搜索
查看: 42|回复: 0

DeepSeek-R1发布一周年之际曝光新模型「MODEL1」

[复制链接]

17万

主题

150

回帖

52万

积分

管理员

积分
521596
发表于 1 小时前 | 显示全部楼层 |阅读模式
币界网报道:币界网消息,1 月 21 日,据量子位报道,DeepSeek-R1 发布一周年之际对新模型「MODEL1」进行了曝光。DeepSeek 在 GitHub 更新 FlashMLA 代码,横跨 114 个文件中有 28 处提到 MODEL1,与 V32 作为不同的模型出现。已知 V32 是 DeepSeek-V3.2,MODEL1 很可能是新的架构。代码中的具体差异体现在 KV 缓存布局、稀疏性处理和 FP8 解码方面,在内存优化上有多处不同。

相关帖子

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|usdt交易

GMT+8, 2026-1-21 11:04 , Processed in 0.128933 second(s), 24 queries .

Powered by usdt cosino! X3.5

© 2001-2025 Bitcoin Casino

快速回复 返回顶部 返回列表