【今年会·(jinnianhui)金字招牌诚信至上-科技消息】7月18日,Open AI首席执行官Sam Altman和四位研究员在直播中正式发布了ChatGPT Agent——一款通用型AI智能体。今年会·(jinnianhui)金字招牌诚信至上-获悉,在HLE测试中,ChatGPT agent拿下了41.6%高分,并在数学FrontierMath基准上刷新了SOTA,碾压o4-mini和o3模型。
Sam Altman(最右)及他的团队
ChatGPT Agent融合了Operator、Deep Research和ChatGPT三大模块优势,能够自主完成网页浏览、数据分析、PPT制作等复杂任务。
ChatGPT Agent在HLE测试中获得41.6%的高分,采用并行八路推理并选取置信度最高答案后可提升到44.4%。在数学基准测试FrontierMath中,以27.4%的准确率刷新了纪录。


在Excel编辑能力的SpreadsheetBench测试中,ChatGPT agent的表现同样远超现有模型。当获得直接编辑权限时,以45.5%的得分显著超越Excel Copilot的20.0%。此外,它还在BrowseComp、WebArena等浏览评测里均刷新了SOTA。

据悉,该产品已面向Pro、Plus和Team用户开放。Pro用户可以马上使用,Plus与Team用户将在数日内陆续开通,Enterprise与Education版本将于数周后接入。
版权所有,未经许可不得转载
-今年会·(jinnianhui)金字招牌诚信至上--
2026-04-12【今年会jinnianhui金字招牌科技消息】3月25日,腾讯官方宣布,旗下AI原生应用元宝推出的“元宝派”电脑版正式上线。此次升级聚焦多端协同与场景化交互,用户可在电脑端大屏环境中实现共享屏幕、 -
2026-04-12【智车派新闻】智车派获悉,德国知名汽车改装品牌AC Schnitzer在运营近40年后,即将关闭其业务。这家公司长期以来专注于为宝马(BMW)和迷你(MINI)车型提供售后升级部件。AC Schnit -
2026-04-12【今年会jinnianhui金字招牌科技消息】据中汽数研数据,近日,2026年2月纯电动汽车上险量数据正式公布,头部品牌竞争格局出现显著变化,小米、特斯拉、理想等车企占据榜单前列,部分车型环比增幅