欧美成人免费mv在线播放,欧美人成人亚洲专区中文字幕,国产做爰免费视频观看

C114
通信人家園
English
公眾號矩陣

投稿
舉報

量子大觀

通信人家園

C114通信網(wǎng)

光通信觀察

DVBCN中廣5G

2025/7/18 08:51

OpenAI 史上最強 ChatGPT 智能體發(fā)布：瀏覽網(wǎng)站、寫代碼、做 PPT 樣樣精通

IT之家汪淼

OpenAI 今日凌晨宣布將在 ChatGPT 中推出一款通用型 AI 智能體，該公司表示該智能體可以幫助用戶完成各種基于計算機的任務(wù)。

OpenAI 介紹稱，該智能體可以自動生成可編輯的演示文稿和幻燈片、查看用戶的日歷來簡要介紹即將到來的客戶會議、計劃并購買制作家庭早餐的食材，以及運行代碼等。

該工具名為 ChatGPT agent，結(jié)合了 OpenAI 之前多種智能體工具的功能，包括 Operator 點擊網(wǎng)站的能力，以及 Deep Research 從數(shù)十個網(wǎng)站中綜合信息生成簡潔研究報告的能力。OpenAI 表示用戶只需通過自然語言提示 ChatGPT 即可與該智能體進行交互。

為了開發(fā)這個新工具，OpenAI 將其背后的 Operator 和 Deep Research 團隊合并為一個統(tǒng)一的團隊。外媒 The Verge 報道稱，這個新團隊由產(chǎn)品和研究部門共 20~35 人組成。

OpenAI 表示 ChatGPT 智能體比其之前的任何產(chǎn)品都要強大得多，可以訪問 ChatGPT 連接器，允許用戶連接像 Gmail 和 GitHub 這樣的應(yīng)用，智能體可以根據(jù)用戶的提示找到相關(guān)信息。此外，OpenAI 表示 ChatGPT 智能體可以訪問終端，并可以使用 API 來訪問某些應(yīng)用。

根據(jù) OpenAI 的說法，ChatGPT 智能體的底層模型在多個基準(zhǔn)測試中提供了最先進的性能。ChatGPT 智能體模型在 Humanity's Last Exam（pass@1）中得分率為 41.6%，這是一項由數(shù)千個問題組成的、涵蓋超過一百個學(xué)科的困難測試。這個分?jǐn)?shù)大約是 OpenAI o3 和 o4-mini 得分的兩倍。

在已知最難的數(shù)學(xué)基準(zhǔn)測試之一 FrontierMath 中，OpenAI 表示，當(dāng) ChatGPT 智能體可以訪問工具（IT之家注：如用于代碼執(zhí)行的終端）時，其得分為 27.4%，之前的最佳分?jǐn)?shù)來自 o4-mini（得分僅為 6.3%）。

在 DSBench 測試中，該測試旨在評估智能體在涵蓋數(shù)據(jù)分析和建模等現(xiàn)實數(shù)據(jù)科學(xué)任務(wù)中的表現(xiàn)，ChatGPT 智能體顯著超越了之前的最先進模型 —— 尤其在數(shù)據(jù)分析任務(wù)中，其表現(xiàn)明顯優(yōu)于人類水平。

在 SpreadsheetBench 平臺上，該平臺通過評估模型在處理基于真實世界場景的電子表格編輯任務(wù)時的表現(xiàn)來進行評分，ChatGPT 智能體創(chuàng)下了新的行業(yè)領(lǐng)先水平（SOTA），其性能較當(dāng)前行業(yè)領(lǐng)先的 GPT 4o 提升了超過一倍。當(dāng)具備直接編輯電子表格的能力時，ChatGPT 智能體的得分進一步提升至 45.5%，與 Excel 中 Copilot 的 20.0% 相當(dāng)。

在內(nèi)部基準(zhǔn)測試中，該模型展現(xiàn)了其處理投資銀行分析師（1 至 3 年經(jīng)驗）任務(wù)的能力，例如為《財富》500 強企業(yè)構(gòu)建符合規(guī)范的財務(wù)報表模型（包括格式和引用），或為私有化交易構(gòu)建杠桿收購模型。ChatGPT 智能體所采用的模型在該測試中顯著優(yōu)于深入研究和 o3 模型。每個任務(wù)均根據(jù)數(shù)百項與正確性和公式使用相關(guān)的標(biāo)準(zhǔn)進行評分。

在 WebArena 基準(zhǔn)測試中（該測試旨在評估網(wǎng)絡(luò)瀏覽智能體在完成真實世界網(wǎng)絡(luò)任務(wù)時的性能），該模型相較于由 o3 驅(qū)動的 CUA（即驅(qū)動 Operator 的模型）表現(xiàn)更佳。

ChatGPT 智能體在 BrowseComp 上的表現(xiàn)方面（OpenAI 今年早些時候發(fā)布的基準(zhǔn)測試），用于衡量瀏覽智能體在網(wǎng)絡(luò)上查找難以找到的信息的能力。該模型以 68.9 的成績創(chuàng)下了新的 SOTA 紀(jì)錄，比深入研究高出 xx 個百分點。

　　具體使用場景方面：

在工作中，用戶可以自動處理重復(fù)性任務(wù)，例如將截圖或面板轉(zhuǎn)換為由可編輯矢量元素組成的演示文稿、重新安排會議、規(guī)劃并預(yù)訂外出活動，以及在保持原有格式的同時，用新的財務(wù)數(shù)據(jù)更新電子表格。

在個人生活中，用戶可以規(guī)劃并預(yù)訂旅行行程、設(shè)計并預(yù)訂整個晚宴活動，或?qū)ふ覍I(yè)人士并安排預(yù)約。

安全方面，OpenAI 表示用戶將始終掌握控制權(quán)。ChatGPT 在執(zhí)行重要操作前會先征得用戶的許可，用戶可隨時中斷操作、接管瀏覽器或停止任務(wù)。

用戶可以通過編輯器中的工具下拉菜單直接激活 ChatGPT 的新智能體功能，只需在任何對話的任何階段選擇“智能體模式”即可。只需描述希望完成的任務(wù) —— 無論是進行深入研究、制作幻燈片，還是提交費用報銷。在執(zhí)行任務(wù)時，屏幕上的語音播報會實時展示 ChatGPT 的具體操作流程。用戶可隨時中斷并接管瀏覽器操作，確保任務(wù)始終與目標(biāo)保持一致。

此外，用戶可設(shè)置已完成的任務(wù)自動重復(fù)執(zhí)行，例如每周一早上自動生成周度指標(biāo)報告。

ChatGPT 智能體即日起向 Pro、Plus 和 Team 版用戶開放，Enterprise 和 Education 版用戶將于 7 月獲得使用權(quán)限。Pro 版用戶每月可執(zhí)行近乎無限的任務(wù)，其他付費用戶每月可執(zhí)行 50 次任務(wù)，額外使用量可通過靈活的積分額度選項獲取。

OpenAI 表示，ChatGPT 智能體仍處于早期階段—— 它能夠處理多種復(fù)雜任務(wù)，但仍可能出現(xiàn)錯誤。盡管官方認(rèn)為該功能在生成幻燈片方面具有巨大潛力，但目前該功能仍處于測試階段 —— 當(dāng)前生成的內(nèi)容在格式和細(xì)節(jié)處理上可能顯得較為粗糙，尤其是在沒有現(xiàn)有文檔的情況下開始創(chuàng)建時。此外，盡管目前您可以上傳現(xiàn)有電子表格供 ChatGPT 編輯或作為模板使用，但此功能尚未適用于幻燈片。

OpenAI 正在訓(xùn)練 ChatGPT 幻燈片創(chuàng)建功能的下一代版本，以生成更精致、更復(fù)雜的輸出，并具備更廣泛的功能和改進的格式化能力。

OpenAI 計劃以定期的節(jié)奏逐步添加重大改進，并使 ChatGPT 智能體隨著時間的推移對更多人越來越有用。

免責(zé)聲明：本文僅代表作者個人觀點，與C114通信網(wǎng)無關(guān)。其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本站證實，對本文以及其中全部或者部分內(nèi)容、文字的真實性、完整性、及時性本站不作任何保證或承諾，請讀者僅作參考，并請自行核實相關(guān)內(nèi)容。

給作者點贊

0 VS 0

寫得不太好

相關(guān)鏈接

OpenAI AI 計算機測試網(wǎng)絡(luò)

中國聯(lián)通陳忠岳：智能體是AI實現(xiàn)商業(yè)價值轉(zhuǎn)化的關(guān)鍵
C114通信網(wǎng) 7-19
孫正義瘋狂依舊！軟銀計劃今年部署10億個AI智能體
C114通信網(wǎng) 岳明7-18
OpenAI擴大電商收入：開發(fā)ChatGPT結(jié)賬系統(tǒng)，從產(chǎn)品銷售抽成
鳳凰網(wǎng)科技簫雨7-17
AI巨頭自研瀏覽器，OpenAI要防蘋果、谷歌卡脖子？
鳳凰網(wǎng)科技蕭雨7-17

特別策劃

亚洲黄色在线-91爱看-日本免费一区二区三区四区-在线中文字幕网站-亚洲精品视频一区-欧美特黄一级