“2025 is going to be the year of Agent。”
在今天凌晨的召开的发布会上,OpenAI 发布了全套 Agent 开发套件,你还因为没有 Manus 邀请码而感到焦虑嘛?不要担心,手搓 Manus 指日可待!
先简单总结一下重点内容:
Responses API:这完全可以视作 Chat API 的升级版内置工具 (Built-in Tools):这里的工具一共有三个,分别是网页搜索、文件搜索 和 Computer Using Agent(CUA)Agents SDK:真“Open”AI 来了!这是一个开源的 Agent 框架,单 Agent 和多 Agent 系统都可以构建监控工具:帮助追踪和检查 Agent 的执行过程如果上次的 GPT4.5 略显幽默,那这次的全新套件只能说 OpenAI 小伙立正了,来,一起看看有哪些要点吧!1、Responses API:今天抛弃老 API
虽然原本的 Chat Completions API 并不会下架,但 Pesponses API 既兼容老 API,又会持续更新新功能,除了老 API 没有的Web 搜索、文件搜索、计算机使用(注意一下)功能,未来还将推出音频和代码解释器,完全没理由不用心的。
只需要稍微修改下代码格式,就可以成功调用了。
简单来说,Responses API 简洁强大、内置工具、统一设计、直观清晰……优点有点多,其实 2023 年 OpenAI 就搞了一个用于 Agent 开发的 API,又贵又不好用,如今也算是走向正轨了。
2、Web Search:啥都能配置,就是略贵
OpenAI 的 API 终于支持搜索了!国家、时区、搜索量等,可以配置的东西还不少,就是价格看起来有些贵,Google Search 的价格是 5 美元 1000 次,Bing Search 的价格是 20 美元 1000 次,但 Open AI 的价格最便宜的 25 美元 1000 次,最贵的达到了 50 美元 1000 次。
3、File Search:版本更新
文件搜索不是新功能,只是一次更新,如今支持包括常见的 .pdf、.docx、.pptx 等 21 种格式(包括 utf-8、utf-16 以及 ascii),价格调用 1000 次 2.5 美元,存储 1 GB 每天 0.1 美元。
4、CUA:截图就能自动化
Computer Use Agent 可以让 AI 通过截图界面理解来执行交互操作,从而实现自动化功能,它可以识别鼠标单击、双击、滚动、坐标、路径,输入文本、等待、组合键、截图等共 9 种行为,然后 CUA 进行自动的执行,就能操作电脑了。
现在 GitHub 已经有项目了,可以去试试。
https://github.com/openai/openai-cua-sample-app
5、Agents SDK:硬菜来咯
直接上 GitHub 地址:https://github.com/openai/openai-agents-python
这是一个支持 multi-agent 的框架,只要符合 OpenAI Chat Completions API 的模型都能用,也就是说 DeepSeek 也能用,这想象空间就太大了。
或许对我们这些普通用户来说,这次发布会并不那么“亲切”,但 Agent 套件的发布,必将快速改变我们的日常生活,或许在某个被智能体服务的日子里,你会想起今天清晨的第一抹阳光。