科技媒體 testingcatalog 昨日(5 月 13 日)發布博文,報道稱 Anthropic 即將發布 Claude Neptune 新 AI 模型,目前正接受內部安全測試,推出后預估與 OpenAI 的 GPT-5,以及谷歌的 Gemini Ultra 競爭。
IT之家援引博文介紹,該模型已進入內部安全測試階段,使用 Anthropic Workbench 平臺進行評估,紅隊演習(主要測試模型對越獄攻擊的抵抗力)將于 5 月 18 日結束。
本次演習重點測試 constitutional classifiers 系統(安全協議的核心),特別關注越獄嘗試的防范,初期測試結果表明對安全問題,比以往模型更敏感(更強大)。
該媒體推測 Anthropic 可能會在 5 月底或者 6 月初發布 Claude Neptune 模型,將讓它直接對抗 OpenAI 的 GPT-5 和 Google 的 Gemini Ultra,預計將加強多模態和智能體功能。