DeepSeek首次回应蒸馏OpenAI质疑 :没有故意加入合成数据
时间:2025-09-18 | 作者: | 阅读:09月18日消息,近日,由DeepSeek团队共同完成、梁文锋担任通讯作者的DeepSeek-R1研究论文登上国际权威期刊《Nature》封面,DeepSeek在论文中正面回应了有关模型蒸馏的质疑。
DeepSeek表示,DeepSeek-V3-Base的训练数据仅来自普通网页和电子书,不包含任何合成数据,在预训练冷却阶段,也没有故意加入OpenAI生成的合成数据,此阶段使用的数据都是通过网页抓取的。
不过,DeepSeek也承认已观察到一些网页包含大量OpenAI模型生成的答案,这可能导致基础模型间接受益于其他强大模型的知识。
此外,DeepSeek-V3-Base的数据截止时间为2024年7月,当时尚未发布任何公开的先进推理模型,这进一步降低了从现有推理模型中无意蒸馏的可能性。
DeepSeek还强调,R1并非通过复制OpenAI模型生成的推理示例来学习,只是和大多数其他大语言模型一样,R1的基础模型是在网络上训练的,因此它会吸收互联网上已有的AI生成的内容。
研究团队采用了纯强化学习框架,并引入组相对策略优化算法,仅依据最终答案的正确与否给予奖励,而非让模型模仿人类推理路径,让模型在实践中自然涌现出自我反思、自我验证等高级行为。
Hugging Face的机器学习工程师Lewis Tunstall也表示,现有证据已相当明确地表明,仅使用纯强化学习即可获得极高性能,DeepSeek的推理方案可能足够优秀而无须使用OpenAI模型进行蒸馏。
来源:https://news.mydrivers.com/1/1075/1075392.htm
免责声明:文中图文均来自网络,如有侵权请联系删除,心愿游戏发布此文仅为传递信息,不代表心愿游戏认同其观点或证实其描述。
相关文章
更多-
- AO3怎么设置语言
- 时间:2026-04-08
-
- DeepSeek专家模式上线!深度思考+极速Token 复杂难题一键搞定
- 时间:2026-04-08
-
- 清明节祭祀用品与时俱进!有OpneClaw、deepseek等AI纸扎模型 网友:希望爷爷喜欢
- 时间:2026-03-31
-
- 最榜单合集4的人工智能软件有哪几款
- 时间:2026-03-10
-
- 刘美含吐槽一个字5家AI读音不一样 百度回应了 这个字的读音到底咋回事
- 时间:2026-03-03
-
- Anthropic指控DeepSeek等中国AI大模型抄袭 遭马斯克贴脸开骂:贼喊捉贼 大规模窃秘数据
- 时间:2026-02-24
-
- 一年了 美国还在追着抹黑!曝DeepSeek春节再扔王炸 最新披露
- 时间:2026-02-14
-
- 9项自查+3招防护!国安部最新数据安全防护攻略请查收
- 时间:2026-02-04
精选合集
更多大家都在玩
大家都在看
更多-
- DNF2026魔道技能数据大核心要点全凸显
- 时间:2026-04-12
-
- 太空修仙录什么时候出 公测上线时间预告
- 时间:2026-04-12
-
- 战地6NVO288E好用配件搭配推荐
- 时间:2026-04-12
-
- 惊爆 烈火星辰传奇技能大,超强玩法等你体验,速来一探究竟
- 时间:2026-04-12
-
- 燕云十六声众生宝箱介绍 全面解析与探秘
- 时间:2026-04-12
-
- 地下城手游迷你商店换什么装备 地下城手游迷你商店的装备选择建议是什么
- 时间:2026-04-12
-
- 绝地求生中眼泪一两声是什么意思 怎么在游戏中触发
- 时间:2026-04-12
-
- 迅雷光鸭云盘开启公测招募:不限速、免登录 2TB免费空间
- 时间:2026-04-12
