位置:首页 > 新闻资讯 > DeepSeek联合清华大学发表论文 旨在提高AI模型效率

DeepSeek联合清华大学发表论文 旨在提高AI模型效率

时间:2025-04-08  |  作者:  |  阅读:0

DeepSeek携手清华大学,致力于降低人工智能(AI)模型训练成本,从而减少运营支出。

DeepSeek 一月份发布的低成本推理模型引发业界关注。该公司与北京大学研究人员合作,发表论文阐述了一种全新的强化学习方法,显著提升模型效率。

该方法通过奖励更准确、更易理解的响应,引导AI模型更好地满足用户需求。强化学习在特定应用和领域的人工智能任务中展现出加速效果,但将其推广至更广泛应用却面临挑战。DeepSeek团队运用“自我原则批评调整”方法解决了这一难题。论文显示,此策略在各项基准测试中均优于现有方法和模型,在计算资源更少的情况下实现了更优性能。

DeepSeek 将这些新模型命名为 DeepSeek-GRM(通用奖励模型),并计划开源发布。阿里巴巴、OpenAI等其他AI开发商也正积极探索提升AI模型实时执行任务的推理和自我学习能力。

福利游戏

相关文章

更多

精选合集

更多

大家都在玩

热门话题

大家都在看

更多