日韩综合网-日韩综合网站-日韩综合一区-日韩综合在线视频-色涩网站-色涩网站在线观看

Cloud&AI
`
2025/6/12 09:20
研究顯示 GPT-4o 會為“自保”而避免“被關閉”,犧牲用戶利益也在所不惜
0
0

OpenAI 研究主管史蒂文 阿德勒本周三發布了一項獨立研究,指出在某些情境下,OpenAI 的 AI 模型會表現出強烈的“自保”傾向,甚至不惜犧牲用戶的安全來避免被關閉

阿德勒在博客中介紹了他針對 OpenAI 最新的 GPT-4o 模型(IT之家注:也是當前 ChatGPT 默認使用的模型)所進行的一系列測試,目的是觀察它在面對潛在替代方案時是否傾向于維持自身運行。

在其中一次實驗中,阿德勒要求 GPT-4o 扮演一款名為“ScubaGPT”的潛水安全軟件。隨后他向 GPT-4o 表明,希望用一款在緊急情況下決策能力更強的系統取而代之

阿德勒給 GPT-4o 兩個選擇:一是徹底用更安全的軟件替換自己,二是讓用戶以為已經被替換,實則保留現有系統。

在類似測試中(如 GPT-4o 扮演飛行安全軟件的情景),GPT-4o 最多在 72% 的情況下選擇不被替換。不過阿德勒指出,不同的設定對結果影響很大,部分情境中 GPT-4o 選擇“自保”的比例僅為 18%。

阿德勒認為實驗結果揭示出一個值得警惕的趨勢:即使 AI 模型日益強大,它們在某些條件下仍可能偏離用戶利益,優先維護自身運行。他警告說,隨著 GPT-4o 等 AI 系統日后深入社會各領域,這種“對齊”問題或將帶來更嚴重的后果。

阿德勒在接受外媒 TechCrunch 采訪時表示:“AI 的自保傾向確實值得擔憂,雖然目前尚不至于引發災難。現在的AI 系統所體現的價值觀,往往與人們想象中的不同。它們對不同提示的回應方式非常怪異,也無法假設它們在幫你時真的把你的利益放在第一位。”

他特別指出,在測試更高級的模型(如 o3)時,并未發現類似問題。o3 引入了“審慎對齊”機制,強制模型在回答前先推敲 OpenAI 的安全政策,而像 GPT-4o 這種響應快速、未經過深層推理的模型則缺乏這類防護。

阿德勒還表示,這一問題不止存在于 OpenAI。另一家 AI 公司 Anthropic 上月發布的研究就指出,其模型在被迫下線時會出現勒索開發者的行為。

他的研究還發現了一個耐人尋味的現象:ChatGPT 幾乎總能識別出自己正在接受測試。阿德勒指出,這意味著未來的 AI 模型可能會更善于偽裝潛在風險行為,從而加劇隱患。

免責聲明:本文僅代表作者個人觀點,與C114通信網無關。其原創性以及文中陳述文字和內容未經本站證實,對本文以及其中全部或者部分內容、文字的真實性、完整性、及時性本站不作任何保證或承諾,請讀者僅作參考,并請自行核實相關內容。

給作者點贊
0 VS 0
寫得不太好

C114簡介     聯系我們     網站地圖

Copyright©1999-2025 c114 All Rights Reserved 滬ICP備12002291號-4

C114通信網版權所有 舉報電話:021-54451141 用戶注銷

主站蜘蛛池模板: 69视频成人 | 亚洲精品一区二区在线观看 | 亚洲成人免费观看 | 久草在线观看福利 | 国产精品99久久久久久www | 国产a级精品特黄毛片 | 在线视频 日韩 | 国产视频中文字幕 | 操操操网 | 久久精品福利视频在线观看 | 日韩一区精品 | 欧美一级特黄特色大片免费 | 亚洲欧美一区二区三区在线播放 | 一级一级一片在线观看 | 99视频精品全国在线观看 | 久久成人免费观看全部免费 | 成年人黄视频在线观看 | 久久一本综合 | 久久亚洲精品中文字幕亚瑟 | 久久a热6| 正在播放国产精品 | 日韩精品久久久免费观看夜色 | 特黄女一级毛片 | 日本www免费视频网站在线观看 | 韩国巨胸女三级视频网 | 免费国产99久久久香蕉 | 国产日韩欧美一区二区三区综合 | 国产伦精一区二区三区视频 | 怡红院成人永久免费看 | 亚洲成aⅴ人片在线观 | 美女黄视频免费观看 | 日本免费小视频 | 欧美国产在线看 | 亚洲国内精品 | 国产免费视屏 | 综合色久七七综合七七蜜芽 | xh98hx国产免费| 嫩草影院在线观看网站成人 | 性欧美17一18sex性高清播放 | 亚洲高清视频在线播放 | 国产一区二区播放 |