杨植麟在GTC 2026分享Kimi技术路线 提出突破大模型智能上限三大维度
时间:2026-03-18 | 作者: | 阅读:0在2026年英伟达GTC大会上,月之暗面Kimi创始人杨植麟指出,要推动大模型智能上限的持续突破,必须对优化器、注意力机制及残差连接等底层基石进行重构。
杨植麟首次系统披露了Kimi模型的技术路线图,将其进化逻辑归纳为三个维度:Token效率、长上下文以及智能体集群。他认为当前的Scaling需要同时在计算效率、长程记忆和自动化协作上寻找规模效应。
在技术重构方面,Kimi团队针对传统Adam优化器开发了MuonClip优化器,解决了Logits爆炸问题并实现2倍于AdamW的计算效率。针对全注意力机制,团队提出了Kimi Linear混合线性注意力架构,在超长上下文中将解码速度提升5到6倍。
针对残差连接问题,Kimi引入Attention Residuals方案,通过Softmax注意力替代传统加法累加,解决了隐藏状态随深度增加而稀释深层贡献的问题。
在跨模态研究方面,杨植麟指出视觉强化学习能够显著反哺文本性能,经过视觉RL训练后模型在纯文本基准测试上表现提升约2.1%。
最后杨植麟探讨了智能体集群的扩展,Kimi K2.5引入Orchestrator机制,能够将复杂任务拆解给数十个子Agent并行处理,并设计了新的并行RL奖励函数来防止协作过程中的串行塌缩问题。
来源:https://news.pconline.com.cn/2116/21169632.html
免责声明:文中图文均来自网络,如有侵权请联系删除,心愿游戏发布此文仅为传递信息,不代表心愿游戏认同其观点或证实其描述。
相关文章
更多-
- 小米汽车推出10万公里里程奖励活动 车主可领取定制实体徽章
- 时间:2026-04-18
-
- 新手Vlog相机选择:佳能PowerShot V1 轻松拍出质感大片
- 时间:2026-04-18
-
- 苹果2026款Mac Studio前瞻:M5芯片加持最高256GB内存延续专业性能
- 时间:2026-04-18
-
- 企业微信十岁了 进化了5次 每天服务超7.5亿人
- 时间:2026-04-18
-
- 拿钱排队都不一定给货!国产存储双雄进入先款排产模式
- 时间:2026-04-18
-
- 《生化9》再爆猛料!中西晃史确认5月更新:佣兵模式有望回归
- 时间:2026-04-18
-
- 苹果iPhone 18 Pro系列将推深樱桃色 灵动岛设计进一步缩小
- 时间:2026-04-18
-
- 当贝鱼缸2S Ultra发布倒计时2天:三位顶级造景大师齐声叫好!
- 时间:2026-04-18
精选合集
更多大家都在玩
大家都在看
更多-
- gmail 退出 不同版本有什么区别
- 时间:2026-04-18
-
- 方舟 发掘猴子在游戏中的多重能力
- 时间:2026-04-18
-
- 《恶魔复仇者TD》 以游戏为主的恶魔与塔防之间的殊死战斗
- 时间:2026-04-18
-
- 怎么有效保护恐龙 探索游戏机制
- 时间:2026-04-18
-
- 网络热词ん察觉是什么意思
- 时间:2026-04-18
-
- 罗丽好听的网名女生英文(精选100个)
- 时间:2026-04-18
-
- tcp udp 是什么?基础说明与使用场景
- 时间:2026-04-18
-
- 嵌入式洗碗机安装要拆橱柜吗?
- 时间:2026-04-18