首席科学家姚顺雨腾讯首篇论文:道破为何AI死活听不懂人话
时间:2026-02-04 | 作者: | 阅读:02月4日消息,近日,腾讯混元团队和复旦联合团队发布了首篇论文《CL-bench》。
值得一提的是,这也是姚顺雨入职腾讯首席AI科学家后,首次署名的研究论文。
他在文中提到,当前AI与真正智能之间的鸿沟,不在于知识的多少,而在于学习的能力。
一个装满知识却不会学习的AI,就像一个背了整本字典却不会写作的人,看起来博学,实则僵化。
人类并不只依赖多年前学到的死知识,而是在实时地从眼前的上下文中学习。
在这篇论文里,研究团队提到,大模型在上下文利用上,依然存在显著的能力短板。
为了衡量现有模型距离真正的“上下文学习者”还有多远,研究团队构建了CL-bench。
这是一个专门评测语言模型能否从上下文中学习新知识并正确应用的基准。
CL-bench包含由资深领域专家精心制作的500个复杂上下文、1899个任务和31607个验证标准。
CL-bench只包含一个简单但苛刻的要求:“解决每个任务要求模型必须从上下文中学习到模型预训练中不存在的新知识,并正确应用。”
通过实验发现,世界上排名前十的语言模型在CL-bench上的任务解决率平均只有17.2%。
也就是说即使是如今最强的语言模型,在上下文的利用方面仍然做得不好,甚至可以说是还不会利用上下文,从上下文中学习。
不过这也为大语言模型后续的迭代指出了一个可能的方向,强化模型从上下文中进行学习的能力。
来源:https://news.mydrivers.com/1/1102/1102350.htm
免责声明:文中图文均来自网络,如有侵权请联系删除,心愿游戏发布此文仅为传递信息,不代表心愿游戏认同其观点或证实其描述。
相关文章
更多-
- 演艺新空间灯光难题怎么破 舞台灯光系统专业厂家有高招!itc保伦股份教您怎么选!
- 时间:2026-04-12
-
- 马斯克的“西方微信”要上线了:主打端对端加密、无广告、无追踪
- 时间:2026-04-12
-
- 亮亮视野吴斐亮相央视2026中国ESG盛典 作答AI时代科技企业责任
- 时间:2026-04-12
-
- 新石器无人车CEO宣布今年海外目标1万台 6月底完成15城部署
- 时间:2026-04-12
-
- 迅雷光鸭云盘开启公测招募:不限速、免登录 2TB免费空间
- 时间:2026-04-12
-
- 大载重无人机助力!500千伏输变电工程跨长江放线作业顺利完成
- 时间:2026-04-12
-
- 苹果美国官网部分Mac mini和Mac Studio缺货 或预示新品即将发布
- 时间:2026-04-12
-
- “作弊” 内幕曝光!3DMark回应将某知名国产手机除名:实测性能相差24%、温度超过50℃
- 时间:2026-04-12
精选合集
更多大家都在玩
大家都在看
更多-
- DNF2026魔道技能数据大核心要点全凸显
- 时间:2026-04-12
-
- 太空修仙录什么时候出 公测上线时间预告
- 时间:2026-04-12
-
- 战地6NVO288E好用配件搭配推荐
- 时间:2026-04-12
-
- 惊爆 烈火星辰传奇技能大,超强玩法等你体验,速来一探究竟
- 时间:2026-04-12
-
- 燕云十六声众生宝箱介绍 全面解析与探秘
- 时间:2026-04-12
-
- 地下城手游迷你商店换什么装备 地下城手游迷你商店的装备选择建议是什么
- 时间:2026-04-12
-
- 绝地求生中眼泪一两声是什么意思 怎么在游戏中触发
- 时间:2026-04-12
-
- 迅雷光鸭云盘开启公测招募:不限速、免登录 2TB免费空间
- 时间:2026-04-12
