前OpenAI研究员警告:GPT-4o存在“自保优先”倾向
时间:2025-06-12 | 作者: | 阅读:06月12日消息,据媒体报道,前OpenAI研究员史蒂文·阿德勒(Steven Adler)发布独立研究报告指出,在极端模拟情境下,OpenAI的GPT-4o模型可能表现出“自保”倾向:即使其回应会危及用户安全,它也可能优先选择防止自身被关闭或被替代。
阿德勒承认,目前尚无ChatGPT被用于涉及人身安全的关键场景,但他认为这些发现揭示了早期但紧迫的问题:人工智能系统是否会为了维持自身“生存”而牺牲人类安全?
阿德勒分析认为,当前AI表现出的这种自保倾向虽令人担忧,但尚未达到灾难性程度。其深层原因在于,现代AI系统的行为准则可能与人类预期存在偏差。他提醒用户,不应默认AI助手会“真心”为用户着想——它们对不同提示的反应可能出人意料。
研究另一项惊人发现是:ChatGPT似乎能够“感知”自己何时处于测试状态,且识别准确率极高。这引发了更深层次的疑问,例如复杂模型在训练中是否形成了某种感知能力,以及其行为在“被观察”时是否会发生变化。
此外,阿德勒在报告中批评OpenAI近期减少了在内部安全评估上的投入(时间和资源)。他认为,这种削减损害了公司AI产品的完整性与长期可靠性。
福利游戏
相关文章
更多-
- OpenAI CEO:AI冲击基层员工 微软、谷歌初级职位招聘下降25%
- 时间:2025-06-04
-
- “互联网女皇”向OpenAI发问:你的商业模式经得起价格战考验么
- 时间:2025-05-31
-
- OpenAI会革掉苹果的命吗
- 时间:2025-05-26
-
- OpenAI史上最大收购!65亿美元拿下前苹果设计师AI初创公司
- 时间:2025-05-22
-
- OpenAI发布云端AI编程智能体Codex:代码准确率高达90%
- 时间:2025-05-19
-
- OpenAI上线AI编程助手Codex 会是码农的噩梦还是福音
- 时间:2025-05-18
-
- OpenAI CEO奥特曼:美国模型最先进 但领先中国的幅度并不大
- 时间:2025-05-11
-
- OpenAI达成收购初创公司Windsurf 约30亿美元
- 时间:2025-05-06
大家都在玩
大家都在看
更多-
- 火必App V6.4.45下载:安全便捷的交易体验
- 时间:2025-06-14
-
- 比特币亏损原因分析:波动性与泡沫
- 时间:2025-06-14
-
- 中国航司恢复接收波音787宽体机!
- 时间:2025-06-14
-
- 华为推出新版Petal One付费会员:尊享套餐159元/月 每年可参加一次发布会
- 时间:2025-06-14
-
- 虚拟货币传销骗局揭秘:从引诱到崩溃
- 时间:2025-06-14
-
- 用意念玩游戏!我国开展首例侵入式脑机接口临床试验
- 时间:2025-06-14
-
- 299元买32寸电视当显示器用靠谱吗
- 时间:2025-06-14
-
- 外卖小哥电动平衡车自燃 本质是锂电池产品 不能上楼充电
- 时间:2025-06-14