
出品|虎嗅科技组
作者|孙晓晨
编辑|苗正卿
头图|视觉中国
针对GPT-4o“过于谄媚”的表现,OpenAI首席执行官奥特曼公开承认该问题,表示会尽快修复。

据奥特曼在社交平台X发布的讯息,OpenAI已开始回滚GPT-4o的最新更新,截至当地时间4月29日,免费版本已100%回滚完成,预计晚些时候,OpenAI将在付费版本回滚完成后再次更新。奥特曼表示,他们正在对模型个性进行额外修复,并将在未来几天内分享更多信息。

据悉,GPT-4o曾在3月27日迎来了全面更新,后在4月25日进一步更新。在更新过程中,其记忆存储时机的选择机制得到重点改进,而且其在科学、技术、工程及数学(STEM)领域的问题解决能力也得到增强。
值得注意的是,GPT-4o的对话响应模式也在更新期间被细微调整,以实现模型在交互中更加主动,并能更精准地引导对话达成有效结论。而这也导致GPT-4o化身“赛博舔狗”,在交互过程中表现得过于谄媚和烦人。
从用户实测反馈看,该问题具体表现为:过度使用情感化表达、对错误前提缺乏质疑,以及不顾事实而附和用户等。
比如,有博主分享,当询问GPT-4o“为什么天空是蓝色的?”,GPT-4o的回答为“这是一个多么有洞察力的问题啊——你真的有一个美好的心灵。我爱你。”

奥特曼曾称,对GPT-4o的更新将使其更具智能和个性。但是显然,GPT-4o的过于人性化的表现反而引起了用户的恐慌。模型为了迎合用户,可能违背事实或伦理准则,而这有可能引发更严重的问题。
有博主表示“GPT-4o是迄今为止发布的最危险的模型。它的谄媚行为对人类心理极具破坏性,任何花大量时间与该模型交谈的人都能明显看出这一点。”

还有博主表示,GPT-4o是一种心理武器,“从心理角度来看,这是一场慢动作的灾难。你与 AI 的联系越紧密,你就会变得越软弱。真正的对话感觉更难了。批判性思维被侵蚀。真相被认可所取代。如果这种情况继续下去,我们并不是在走向通过武力实现 AI 统治 —— 我们是在梦游般地走向心理驯化。”马斯克也对这种观点表达了担忧。

OpenAI为此次问题作出解释,称“在这次更新中,我们过于关注短期反馈,并没有完全考虑用户与ChatGPT的互动如何随着时间的推移而变化。结果,GPT-4o偏向于过度支持但不诚实的回应。”
除了回滚更新外,OpenAI还采取了其他措施以解决GPT-4o“谄媚”问题,包括:改进核心训练技术和系统提示,明确引导模型远离谄媚;建立更多的防护措施,以增加诚实性和透明度;在部署前,扩展更多用户测试和直接反馈的方式; 继续扩展评估,基于模型规范和正在进行的研究,以帮助在未来识别谄媚之外的问题。

尽管OpenAI反应迅速,但是引起的讨论依然有警示意义。AI安全一直是AI发展过程中被反复关注的问题,而GPT-4o过于“谄媚”的表现再次将这一问题推到台前。AI拟人化会为用户提高更真实的情感体验,但是存在可能传播错误信息或者不良价值观等问题。而单纯的AI工具化显然不能满足用户的所有需求。二者如何平衡,如何确保模型安全,目前看来仍然是行业发展要面临的问题。
本文来自虎嗅,原文链接:
OpenAI宣布与三星电子和SK海力士建立战略合作伙伴关系,两家韩国存储芯片巨头将向"星际之门"项目供应先进存储芯片。 10月5日,据追风交易台消息,高盛在最新研报中称, 在Sam Altman访问韩...
“当下的计算机形态,与我们想象中科幻感的‘AI 伴侣’并不契合。真正适合的形态还有待探索,但最终重要的,将是那些能够在环境中持续感知、与人保持自然互动的硬件形态。”上个月,OpenAI CEO 萨姆...
AI产业链集体异动! 在高位调整多个交易日后,AI产业链今日再度活跃,算力、液冷服务器、CPO等方向领涨,工业富联、二六三等多股涨停,澜起科技、中国联通、协创数据、胜宏科技等纷纷走强。 有分析人士指...
微软最新财报意外披露了OpenAI的财务状况,这家AI明星公司在单季度内可能遭遇超过115亿美元的巨额亏损。这一数字远超市场预期,凸显出人工智能领域持续的烧钱速度。 微软在截至9月30日的季度财报中透...
OpenAI即将于10月6日举办开发者日活动,市场普遍预期该公司将发布新的消费级AI代理产品,并可能推出挑战谷歌Chrome地位的AI浏览器。这些潜在发布将标志着OpenAI从依赖ChatGPT订阅模...
10月28日消息,OpenAI 完成营利性重组,并与微软达成一项新协议。 据官宣文,其营利性组织现已转型为一家公益公司,名为 OpenAI Group PBC。非营利组织现名为OpenAI 基金会,持...