当前位置: 首页 » 资讯 » 新科技 » 正文

OpenAI全新 Agent 套件来了,可以手搓Manus,5大要点一网打尽

IP属地 北京 编辑:杨凌霄 太平洋科技 时间:2025-03-12 10:04:53

“2025 is going to be the year of Agent。”

在今天凌晨的召开的发布会上,OpenAI 发布了全套 Agent 开发套件,你还因为没有 Manus 邀请码而感到焦虑嘛?不要担心,手搓 Manus 指日可待!

先简单总结一下重点内容:

Responses API:这完全可以视作 Chat API 的升级版内置工具 (Built-in Tools):这里的工具一共有三个,分别是网页搜索、文件搜索 和 Computer Using Agent(CUA)Agents SDK:真“Open”AI 来了!这是一个开源的 Agent 框架,单 Agent 和多 Agent 系统都可以构建监控工具:帮助追踪和检查 Agent 的执行过程如果上次的 GPT4.5 略显幽默,那这次的全新套件只能说 OpenAI 小伙立正了,来,一起看看有哪些要点吧!

1、Responses API:今天抛弃老 API

虽然原本的 Chat Completions API 并不会下架,但 Pesponses API 既兼容老 API,又会持续更新新功能,除了老 API 没有的Web 搜索、文件搜索、计算机使用(注意一下)功能,未来还将推出音频和代码解释器,完全没理由不用心的。

只需要稍微修改下代码格式,就可以成功调用了。

简单来说,Responses API 简洁强大、内置工具、统一设计、直观清晰……优点有点多,其实 2023 年 OpenAI 就搞了一个用于 Agent 开发的 API,又贵又不好用,如今也算是走向正轨了。

2、Web Search:啥都能配置,就是略贵

OpenAI 的 API 终于支持搜索了!国家、时区、搜索量等,可以配置的东西还不少,就是价格看起来有些贵,Google Search 的价格是 5 美元 1000 次,Bing Search 的价格是 20 美元 1000 次,但 Open AI 的价格最便宜的 25 美元 1000 次,最贵的达到了 50 美元 1000 次。

3、File Search:版本更新

文件搜索不是新功能,只是一次更新,如今支持包括常见的 .pdf、.docx、.pptx 等 21 种格式(包括 utf-8、utf-16 以及 ascii),价格调用 1000 次 2.5 美元,存储 1 GB 每天 0.1 美元。

4、CUA:截图就能自动化

Computer Use Agent 可以让 AI 通过截图界面理解来执行交互操作,从而实现自动化功能,它可以识别鼠标单击、双击、滚动、坐标、路径,输入文本、等待、组合键、截图等共 9 种行为,然后 CUA 进行自动的执行,就能操作电脑了。

现在 GitHub 已经有项目了,可以去试试。

https://github.com/openai/openai-cua-sample-app

5、Agents SDK:硬菜来咯

直接上 GitHub 地址:https://github.com/openai/openai-agents-python

这是一个支持 multi-agent 的框架,只要符合 OpenAI Chat Completions API 的模型都能用,也就是说 DeepSeek 也能用,这想象空间就太大了。

或许对我们这些普通用户来说,这次发布会并不那么“亲切”,但 Agent 套件的发布,必将快速改变我们的日常生活,或许在某个被智能体服务的日子里,你会想起今天清晨的第一抹阳光。

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。

全站最新