杨植麟在GTC 2026分享Kimi技术路线 提出突破大模型智能上限三大维度
时间:2026-03-18 | 作者: | 阅读:0在2026年英伟达GTC大会上,月之暗面Kimi创始人杨植麟指出,要推动大模型智能上限的持续突破,必须对优化器、注意力机制及残差连接等底层基石进行重构。
杨植麟首次系统披露了Kimi模型的技术路线图,将其进化逻辑归纳为三个维度:Token效率、长上下文以及智能体集群。他认为当前的Scaling需要同时在计算效率、长程记忆和自动化协作上寻找规模效应。
在技术重构方面,Kimi团队针对传统Adam优化器开发了MuonClip优化器,解决了Logits爆炸问题并实现2倍于AdamW的计算效率。针对全注意力机制,团队提出了Kimi Linear混合线性注意力架构,在超长上下文中将解码速度提升5到6倍。
针对残差连接问题,Kimi引入Attention Residuals方案,通过Softmax注意力替代传统加法累加,解决了隐藏状态随深度增加而稀释深层贡献的问题。
在跨模态研究方面,杨植麟指出视觉强化学习能够显著反哺文本性能,经过视觉RL训练后模型在纯文本基准测试上表现提升约2.1%。
最后杨植麟探讨了智能体集群的扩展,Kimi K2.5引入Orchestrator机制,能够将复杂任务拆解给数十个子Agent并行处理,并设计了新的并行RL奖励函数来防止协作过程中的串行塌缩问题。
来源:https://news.pconline.com.cn/2116/21169632.html
免责声明:文中图文均来自网络,如有侵权请联系删除,心愿游戏发布此文仅为传递信息,不代表心愿游戏认同其观点或证实其描述。
相关文章
更多-
- 315曝光AI投毒、租赁电动自行车狂飙 市场监管总局通报最新进展
- 时间:2026-03-20
-
- 内存涨价潮席卷全球:32G内存条从800元暴涨到3800元,涨幅高达300%
- 时间:2026-03-20
-
- 全球首创!量子电池原型诞生:可实现飞秒充电、纳秒储能
- 时间:2026-03-20
-
- 行业还在修修补补 海信玲珑4芯真彩背光重新定义画质天花板
- 时间:2026-03-20
-
- 中国电竞显示器TOP10出炉:AOC夺双第一、小米第七
- 时间:2026-03-20
-
- 视频面试能开小窗、简历一拖就发 鸿蒙版BOSS直聘把求职痛点一个个填上
- 时间:2026-03-20
-
- 强强联手!时的科技与华模科技签约深化战略合作,共筑eVTOL商业化运营体系
- 时间:2026-03-20
-
- 罗永浩开喷苹果:Siri 永远弱智 卡第三方语音输入不能忍
- 时间:2026-03-20
精选合集
更多大家都在玩
大家都在看
更多-
- 大道仙途手游上线时间是哪天
- 时间:2026-03-20
-
- 冷酷美丽网名男生霸气(精选100个)
- 时间:2026-03-20
-
- 地位升级了 内存被美光定义为战略物资:想买要签5年长期合同
- 时间:2026-03-20
-
- 大道仙途手游下载地址分享
- 时间:2026-03-20
-
- 中世纪战略 RPG《王座空悬》现已公开 并加入Hooded Horse发行
- 时间:2026-03-20
-
- 《粒粒的小人国》安家测试开启-预约量突破800万引期待
- 时间:2026-03-20
-
- 一些好听爱的网名男生(精选100个)
- 时间:2026-03-20
-
- 我在末世有间超市好玩吗 我在末世有间超市玩法简介
- 时间:2026-03-20