文|科技新知 林书
回望2024年,一众手机厂商诸如苹果、荣耀等,都试图在AI手机赛道闯出一条路来。然而,时至今日,又有多少厂商交出了令人满意的答卷呢?
就在上周,华为发布了最新Mate70系列,不仅搭载了全新麒麟芯片,还支持纯血鸿蒙HarmonyOS Next,特别在AI影像、隐私保护和智能交互上进行了重大升级。尤其是在AI方面,华为通过推出AI动态照片、隔空传送、智能降噪等九大功能,试图展示其在智能技术领域的持续投入。
然而,仔细审视这些创新,不难发现,它们本质上仍然是现有技术框架下的渐进式改良,而非真正意义上的颠覆性突破。例如最被其称道的AI隔空传送功能,本质上不过是对已有手势识别技术的重新包装。
从技术上来说,它所依赖的不过是手机前置摄像头的感知能力,配合基础的计算机视觉算法,实现简单的手势追踪和识别。这种技术在三星、小米等品牌早已有过尝试,只不过都因为交互体验不够自然而逐渐被市场遗忘。
至于备受关注的"仅你可见"功能,其核心技术不过是基于面部识别的视线追踪算法。这项技术在PC领域早已存在多年,如今不过是被移植到了手机端。况且,其实际使用中的局限性显而易见:它要求用户必须保持特定的观看角度和距离,稍有偏离就会影响识别效果。
除此之外,此次发布会上Mate70展示的其他AI功能,例如AI通话总结、AI修改照片等,更是一些已经司空见惯的“标配技术”,总体上看并无太多新意可言。
这些所谓的AI创新,更像是华为在缺乏实质性AI突破的情况下,不得不推出的一些表面功夫。在真正的AI革命面前,这些功能不过是浮于表面的点缀。
不过,实事求是地说,这样的“创新疲态”,并不仅仅发生在华为一家大厂身上。
AI手机的尴尬现实
事实上,这一年的AI手机赛道,更像是一场平平无奇的技术秀。
苹果的iOS 18虽然大肆宣传"Apple Intelligence",但除了少部分跨应用级的AI调用功能外,其他大部分能力,不过是将ChatGPT等现成技术稍作包装,缺乏根本性的技术突破。
而荣耀在2024年MWC(世界移动通信大会)上,也重点展示了AI领域的新技术突破,特别是在Agent等方面的技术进展。
从总体上看,其Agent技术展现出的自动化能力,确实带给了人们一种“手机即将迈入自动驾驶”时代的想象。
但平心而论,这样的想象背后,却藏着两点难以忽视的隐忧。
例如,在一键点咖啡的场景中,当用户浏览相关信息或下达语音指令时,手机Agent就会直接识别意图,联动相关的外部应用(如支付、地图、订餐等),快速完成订单生成和支付流程。
同样地,面对“关闭APP自动续费功能”这样的请求,荣耀的AI Agent也能自动操作,找到所有开通APP自动续费服务的项目,并询问用户是否要取消。
但站在用户的角度来看,这样的“便捷”是否真的是一种直戳痛点的改进?
在手机这块方寸之间的屏幕上,各类APP的操作,实际上已经简化到了一个接近阈值的状态,对普通消费者来说,点咖啡这些任务,本身并不耗费太多精力,现有的手动操作方式已经足够便捷。在此基础上加入自动化功能,边际效益不但不高,甚至有可能适得其反。
因为自动化功能的加入,虽然看似高效,却可能让一些用户感到学习和适应成本过高。
举例来说,目前荣耀AI Agent 的启动方式,主要是依赖语音交互,但站在用户体验的角度看,这仍是一种被动的,需要有意识地使用的功能。以点咖啡这个场景为例,每当用户想下单时,都需要被动地用语音告诉手机:“我想点XX味的咖啡,要XX杯。”
既然都是被动,这和用户自己用手指多花几十秒操作,又有多大区别?况且,一个很影响体验地方是:在公共场合,或其他不便于语音交互的嘈杂场景,这样的互动方式,多少会让人觉得不自在。
此外,虽然Agent系统的主动操作功能,强调安全性和隐私保护,但手机 Agent在任务自动化过程中,总是需要访问用户的个人数据,包括联系人、位置信息,甚至是各类APP的登录密码等。
要避免这样的隐私问题,Agent 系统只能在执行任务时,一次次地请求用户“授权”“确认”(例如其关闭自动扣款的功能),如此一来,便会不可避免地造成体验割裂的现象。
既然对用户的“扰动”如此频繁,那所谓自动化的意义究竟何在?
对于这点,前苹果设计主管 Jony Ive 认为,AI Agent最大的价值不是取代用户操作,而是创造更自然、更符合人类直觉的交互方式。言外之意,真正的创新在于让技术变得“无形”。
昂贵的AI军备竞赛
Jony Ive 最近与 OpenAI 合作开发新一代AI设备时提出:“我们需要重新思考人机交互的本质。AI不应该是一个需要学习使用的工具,而应该像空气一样自然存在。”
对此,Jony Ive提出了关于“无形”设计理念的三个核心观点:
一是自然交互,当技术真正成功时,它应该消失在背景中。就像我们不会意识到空气的存在一样,最好的AI交互应该是无需思考的;二是情境感知,AI Agent不是简单的命令执行器,而是要理解用户的情境和意图。它应该在适当的时候提供帮助,而不是打扰用户的思维流;三是人性化设计,技术应该适应人类,而不是要求人类适应技术。
简而言之,Jony Ive认为,AI应该更多地充当一个“预判者”的角色,在用户产生需求之前就完成准备,而不是被动地等待用户的指令。
举个例子,想象你正在开车,手机通过多维度数据分析(GPS定位、日历安排、实时路况)发现你可能要去参加下午2点的一个重要会议。
这时,AI系统会主动检测到当前路段正在施工,预计会造成15分钟延误。于是便自动计算出你需要提前10分钟出发,在你还没有主动查询的情况下,就把最优绕行路线推送到你的车载系统。
这样的交互方式,充分利用了手机作为随身设备的特性,将各种零散的数据点(位置、时间、生理数据、日程表等)有机整合,主动为用户创造价值,而不是被动等待指令。
这才是真正符合移动场景的AI应用方式,而不是简单地把电脑上的Copilot或ChatGPT搬到手机上。
如果用这样的标准来看,很显然,无论是华为、荣耀还是苹果,都未能达到这样的“理想境界”。其所谓的“自动化”,仅仅是用语音交互+Agent,将原本并没多复杂的步骤再精简了些许。
这就引出了另一个重要问题:对用户来说,他们是否真的愿意为目前这些华而不实,锦上添花的“AI功能”支付高昂的溢价?
对此,华尔街著名的科技分析师、被誉为“科技股教父”之一的Dan Ives评论道:手机厂商在AI领域的投入将在2024年达到历史新高,但这种投入与实际收益之间存在巨大鸿沟。我们看到的是一场昂贵的“AI军备竞赛”,最终受害的是消费者的钱包。
前期优势正被稀释?
面对手机换机周期不断延长,以及零部件成本持续攀升的双重挑战,对于荣耀来说,在过去的一年多里,其在AI方面的投入,不可谓不激进,2023年,荣耀整体研发投入占到总营收的11.5%,其中AI研发费用累计已达100亿。
尽管自2024年初以来,手机市场已有明显的复苏迹象;但如此“豪赌”AI的背后,其目前呈现的锦上添花式的AI功能,究竟能否在将来真正带动消费者的购机热,这恐怕要打一个大大的问号。
在独立的三年多时间里,荣耀已经发布了Magic系列、数字系列、V系列与X系列四大产品体系,布局了超过30款手机,覆盖2000—10000元价位段。
但问题是,为了在连续下行的全球手机市场中站稳脚跟甚至冲击前五,荣耀不可能仅靠资本们很喜欢的高毛利高端产品来支撑销量,还是需要大量的走量机型。
这就和AI手机高昂的投入,形成了一个尖锐的结构性矛盾。
更讽刺的是,在专业化的大模型企业的攻势下,荣耀等手机厂商重金投入所铸就的AI优势,实际上正一点点被稀释。
今年10月,有着国内“AI六小虎”之称的智谱AI,发布了自身基于Agent技术的手机智能体AutoGLM,直接通过模拟人类操作行为,来实现手机上的各种功能。
智谱AI的定位,实际上是通过AutoGLM这样的技术,创造了一个全新的价值层:它既不是传统意义上的应用层,也不是系统层,而是一个“元操作层”。
大模型企业的入局,可能暗示了手机AI将来一个更大的变化:AI能力正在成为一种“基础设施”,就像当年的互联网一样。对大模型企业来说,他们不需要完整的系统权限,因为未来的应用可能更多是基于API调用的“组合式服务”,而不是传统的独立应用。
如此一来,各大手机厂商推出的独立AI系统,必定会受到更多挑战。但平心而论,即使是这种“实用性存疑”的状态,对很多手机厂商来说,也已经成为了一个难以触及的门槛。
根据益普索发布的《AI Phone白皮书》中的衡量标准,目前业内的手机AI,正处在跨越AI Phone的L2级别,向L3迈进。
L3级别要求手机“能够识别人类情感。实现任务级自主拆解闭环,人与AI协作并监督”。
这就是目前荣耀、苹果的Agent技术所达到的状态。
然而,这样一个并不太高的标准,vivo、OPPO这样的大厂,也不尽然能完全做到。
以vivo为例,其今年展示的AI系统,更多地将焦点放在了“一按一复制,或一按一拖拽”的这种更偏向传统的AI交互形式。虽然其OriginOS 5号称搭载了vivo自研的手机智能体「PhoneGPT」,能实现自动订座这样的功能,但截至目前,其并未展现出公开的演示。
同样地,号称自研了手机大模型的OPPO,在目前的公开展示中,也只是将重点放在了AI识图、AI一键问屏,或是AI修图等传统的功能上,总体上给人感觉仍停留在不痛不痒,可有可无的AI Phone的L1级别。
从目前来看,总体功能聊胜于无,交互方式不够人性、自然,以及专业化大模型企业的竞争等因素,共同构成了目前手机AI所面临的种种挑战。
而对于上述的难题,即使是身为行业巨头的苹果,目前也未能拿出令人满意的答案。
例如在自动化操作方面,Apple Intelligence展示的所谓“智能代理”功能,实际上是对iOS快捷指令的升级版本。虽然系统能够理解“帮我订一张去纽约的机票”这样的指令,但其执行过程仍然需要预先配置的应用程序支持。
这样的情形,似乎让手机AI陷入了一个尴尬的境地:既不够革命性来满足市场期待,又不够完善来证明其存在的价值。
但如果回望过去,我们就会发现:这某种程度上,是因为手机厂商们正在重复PC时代的老路—— 过度强调功能堆砌,而忽视了用户体验的本质。