(图片OpenAI)
OpenAI发布季进入“第十一天”,依然如预期一样没有惊喜,更多是在 AI 层面的“挤牙膏”工作。
钛媒体AGI获悉,北京时间12月20日,美国OpenAI公司宣布ChatGPT与Mac应用深度集成,桌面版ChatGPT能够和Warp(文件共享应用)、XCode编辑器等联动,且支持语音模式下与Notion、苹果备忘录等其他应用协同。
OpenAI首席产品官凯文·韦尔(Kevin Weil)表示,ChatGPT已经从单纯的会话助手向更为强大的 AI Agent(代理)智能体工具进行转变,现在ChatGPT能执行更多任务,为用户带来便捷体验。
今天OpenAI CEO奥尔特曼(Sam Altman)发推文暗示,明天凌晨该公司可能将发布全新AI推理模型 o3,主要原因是他推文中写到“ho ho ho,明天见”、“找到一个线索,应该说 oh oh oh”,三个重复的“o”和“h”。
事实上,之前10个工作日的十场直播活动上,OpenAI并未如外界期待的“放大招”,而是基于ChatGPT在 AI 应用和产品体验上做很多更新。这同时也能明显感知到,OpenAI正在从模型层向Agent智能体层面迈进。
以下是钛媒体AGI 简单梳理此前OpenAI 10场直播带来的更新信息:
Day 1:o1 Pro推理模型正式发布,不再是公开预览版,并需要每月200美元的ChatGPT Pro订阅。 Day 2:OpenAI将焦点完全放在了企业领域。企业用户现在可以利用“强化微调”(Reinforcement Fine-Tuning)技术,根据各自特定的需求来定制o1 mini模型,尤其为研究科学家提供了强化微调模型,用于特定领域的复杂任务。 Day 3:OpenAI的人工智能视频生成工具Sora正式推出,用户可以生成从现实到抽象的各种风格的视频和图像。但相比国内快手可灵、谷歌VEO 2,新版本Sora并未如外界认为的那样惊艳。 Day 4:推出ChatGPT并行设计界面Canvas,允许用户更无缝地与AI协作进行写作和编码项目。 Day 5:ChatGPT和苹果智能“联姻”,OpenAI的ChatGPT如今已整合进最新iOS、iPadOS和macOS系统。有报道称,ChatGPT在回答问题时的准确率就比苹果的Siri高出25%,且能回答30%更多的问题。 Day 6:OpenAI全量上线视觉理解(高级语音模式)和实时屏幕共享,被认为是OpenAI版“Her”满血上线。相较于普通语音模式,高级语音与人类之间对话的节奏更加自然,能够在超50种语言中传达丰富的情感和语调,使用的是多模态4o模型。 Day 7:OpenAI推出Projects In ChatGPT新功能,与其竞争对手Anthropic今年6月在Claude中推出的功能有异曲同工之妙,该服务可以将ChatGPT的各种功能整合至一处,便于用户创建并管理各类项目,它不仅支持Canvas界面,还能通过ChatGPT Search轻松接入互联网资源。 Day 8:ChatGPT搜索功能免费向所有ChatGPT用户开放,基于OpenAI的GPT-4o模型构建,能让使用聊天机器人的用户像在网络上进行常规搜索一样获取即时信息。 Day 9:OpenAI向第三方开发者开放最先进大模型o1 API接口,其中内置实时API更新包括简化版WebRTC集成,GPT-4o音频价格降低60%。每100万输入Tokens的费用为40美元,每100万输出Tokens的费用为80美元。同时,OpenAI还推出GPT-4o mini,每100万输入、输出Tokens费用分别为10美元、20美元,而GPT-4o mini的文本的输入、输出Tokens的起始价格分别为0.60美元、2.40美元。 Day 10:ChatGPT新增“热线”这一互动新方式,新用户可通过电话和WhatsApp与ChatGPT互动,从而提高ChatGPT用户量。美国用户可以拨打1-800-ChatGPT,每月与ChatGPT免费通话15分钟。这是OpenAI首次将ChatGPT集成到WhatsApp平台,并且该服务对用户完全免费。如今,OpenAI这12天马拉松式的"AI嘉年华"发布会即将进入尾声。
有分析认为,现在这看起来更像是一场精心设计的注意力管理战役,通过持续不断的小型更新来稀释竞争对手可能带来的冲击。但更多人认为,这一轮 AI 热潮进入“深入区”,从模型层转向应用层,AI Agent智能体应用的时代已来。
OpenAI首席执行官奥尔特曼曾断言:“我们会有越来越好的模型,但我认为下一个巨大突破将是Agent智能体。”
数据显示,2023年,中国AI Agent智能体市场规模为554亿元,预计至2028年将达8520亿元,年均复合增长率为72.7%。
硅谷孵化器Y Combinator合伙人、资深投资人贾里德·弗里德曼(Jared Friedman)认为,垂直领域AI Agent应用有望成为比SaaS大10倍的新兴市场,凭借替代人工操作、提升效率的显著优势,这一领域可能催生出市值超过3000亿美元的科技巨头。
“坦白说,在整个端侧方面,国内AI智能体应用的发展速度比国外(美国)要快。”12月19日,IIFAA互联网可信认证联盟技术负责人万小飞对钛媒体AGI表示,当前 AI 智能体技术和行业发展仍处于早期阶段,需要通过可信互连方式形成“合力”,从而解决AI智能体带来的新机遇、新风险、新挑战。
与OpenAI一样,华为、荣耀、智谱、蚂蚁等中国公司也都在发力 AI 智能体方向。例如,智谱最新AI应用AutoGLM可以实现自动点外卖、点咖啡;荣耀CEO赵明“一句话让 AI 点了2000杯咖啡”引发关注;蚂蚁集团推出的AI生活管家“支小宝”可实现看天气、买奶茶等服务。
中国信通院泰尔实验室信息安全部副主任傅山认为,手机的硬件厂商还有应用开发者纷纷下场,推出自己的智能体和智能体平台,目标就是“帮人类去玩手机”,让 AI 完成很多特定的决策,业务领域已覆盖到生活的方方面面,包括日常购物,朋友圈评论,旅行规划等。
据Gartner市场研究机构预测,2028年,至少有15%的日常工作决策将由 AI 智能体自主完成。
然而,行业仍处于初期阶段,新技术在带来便利的同时,也伴随着安全风险。傅山提到,随着AI智能体已成为重要布局方向,大模型平台平均每天可增加2-8万个智能体,数量非常庞大,对用户而言,一条指令,往往会涉及到多个App智能体产品,而智能体之间的打通很难。因此,如何确保不同智能体间的可信互联成为亟待解决的关键问题,比如,过度的数据收集带来数据滥用、算法偏见、透明性不足等挑战,大模型技术“幻觉”缺陷带来的用户个人信息保护挑战,模型黑盒算法无法验证个人信息处理安全等。
在IIFAA联盟秘书长郑亮看来,智能体之间的服务互联需要完成用户指令,中间涉及意图数据的共享传递和复杂任务拆解等流程,这些流程在没有规范约束的情况下,就像开车没有红绿灯,容易滋生乱象。
对此,12月19日,国内首个智能体安全生态协作组织“IIFAA智能体可信互连工作组”正式成立,蚂蚁、阿里、华为、智谱、字节跳动、京东、中国移动、高通等成为工作组首批成员。该工作组将针对智能体可信认证、服务可信调用、数据可信流转、用户隐私与权益保护等方面,制定智能体可信互连行业规范,以应对高速发展所带来的安全协作挑战。
蚂蚁集团副总裁李俊奎表示,蚂蚁将支持工作组推动智能体技术在各个应用场景中的广泛普及与信任建立,让AI更安全的服务于用户和行业。
万小飞强调,IIFAA智能体可信互连工作组将建立新的机制、新的标准、新的行业维度,从而实现开放公正、规模化、可持续,并且给更多人和公平机会发展 AI 智能体技术。
“今天倡议这个标准是基于自愿的原则,如果两个APP想打通,我们给它提供一种快速的基础设施和机制。同时,我们并不会去干涉智能体内部的发展,但我们想推动行业快速发展,两个智能体之间的私人协议肯定是不持久、不长远的。我们希望建立一个比较普适普惠的基础设施,能够让未来更多的人、更多的智能体快速做这种相关连接,这是我们这个工作组成立的必要性。”万小飞称。
(本文首发于钛媒体App,作者|林志佳,编辑|胡润峰)