文| 脑极体
AI眼镜,在2024年举起了“复兴”的大旗。
大模型改变的AI硬件中,智能眼镜得到了比尔·盖茨、扎克伯格等人的背书。而产业界也如他们所愿,带来了一波智能眼镜的文艺复兴。尤其是meta和雷朋合作的Ray-Ban meta,拿下百万级销量,彻底点燃了科技界对AI眼镜的热情。
此后,华为在智能眼镜2搭载了最新的鸿蒙4系统和盘古大模型;百度世界大会上,百度正式发布了小度AI眼镜;智能硬件公司Rokid也紧随其后,推出了新一代AR眼镜Rokid Glasses。
还有更多产品蓄势待发,国外的微软、苹果、谷歌、三星,国内的小米、OPPO、vivo、腾讯、字节、魅族等,几乎所有头部科技企业都传出了正在筹备或评估眼镜项目的消息。
不过,经历过谷歌眼镜“挂羊头卖狗肉”的一地鸡毛,很多极客和技术爱好者都对这一波AI眼镜复兴将信将疑。
科幻感十足的智能眼镜,这一次真能告别“电子垃圾”,踏上复兴之路吗?复兴的拐点,或许是千元机时刻的到来。
自从谷歌于2012年开创了智能眼镜的先河,这一品类就一直困在硬件的“周期律”里。
早期的新技术概念产品,受到极客和未来主义者的疯狂追捧,出现爆火和泡沫。但由于需求模糊、技术尚不成熟、产品形态不明确,最终因功能鸡肋,无法大规模普及,被大众消费市场所遗弃,进入沉寂期,然后又随着技术的更新迭代,进入到新一轮的泡沫和衰退。
很多新技术往往只有一次机会,泡沫破灭之后就失去了信誉,比如虚拟币、量子XX。但智能眼镜却总会在AI技术有新突破的时候,又挠得巨头和大众心里痒痒的。
十多年的潮涨潮落,智能眼镜产业也曾留下一地鸡毛,比如Google Glass不得不弃C从B,转向商用场景;Snap Spectacles销量惨淡;腾讯智能眼镜乏人问津……但科技企业、极客和大众总是愿意给智能眼镜一次机会,对它走进现实抱有期待。
这一品类到底有什么特殊?
大概是因为智能眼镜,同时承载了人们对数实融合的美好想象,与近眼显示类可穿戴设备的虚幻承诺。
生活在与现实世界平行的数字世界,一直是科技界和科幻爱好者所共同追求的梦想。让人们不用通过智能手机,就能直接跟物理世界互动,又比VR设备要轻盈舒适,智能眼镜被视为智能手机之后的下一个颠覆性产品。
除了谷歌,国内科技企业如百度,也曾在十年前就开始探索这一赛道。2014年世界大会上,就发布过一款名为BaiduEye的产品,通过语音或手势进行搜索、翻译。据媒体报道显示,BaiduEye的负责人顾嘉唯在离开百度之后,也成为智能硬件行业的连续创业者。
可见,智能眼镜的独特魅力,总会让极客与科技爱好者们一次又一次地被吸引。
但受限于此前技术的不成熟,智能眼镜在隐私保护、显示效果、续航、功能等方面存在难以突破的瓶颈,无法真正在大众消费市场兑现概念产品发布会上的承诺,又让人一次次失望。
困在硬件周期律里的智能眼镜,展现出了顽强的生命力,终于在大模型时代,等来了复兴的拐点。
大模型的到来,彻底改变了智能眼镜的人机交互体验,在语音理解、AI功能实现等方面取得了显著进步,一改过去机器学习时代的人工智障弊端,重燃了大众对智能眼镜的热情。
大模型与智能眼镜的结合,在初期呈现出多条路线并进的趋势。目前,主要有三条产品化路线:
第一条,简单显示的“AI+AR眼镜”。
这类产品以雷朋和meta合作的Ray-Ban meta爆火,成为风向标。产品形态上,将主板、计算平台、光学显示模组等核心组件,高度集成于传统眼镜上,佩戴舒适性最佳,同时兼具时尚性与功能性。叠加摄像头、语音交互、多模态等AI能力,让智能眼镜的产品力有了颠覆式的变化。
百度AI眼镜,传统眼镜品牌LOHO与闪极科技、科大讯飞共同打造的智能眼镜,以及智能硬件公司Rokid推出的Rokid Glasses, Emteq Labs公司推出的Sense智能眼镜等,都属于此类。
与其他智能眼镜产品形态最大的不同,就是人机交互方式采用语音形式。用户可以通过语音指令,唤起内置的基于多模态大模型打造的AI助手,跟AI进行互动,使用实时图像描述、文本翻译等功能。
比如百度AI眼镜内置摄像头,用于拍摄照片和视频,支持与基于百度文心一言(Ernie)构建的语音交互,可以实现旅游场景下的边走边问,运动场景下实时监测卡路里消耗,办公学习场景下多语言翻译。由于背靠百度,AI模型能力与meta同为全球第一梯队,因此百度AI眼镜也被认为是meta Ray-Bans的中国对标产品。
成立于2014年的Rokid,多年来在AR眼镜领域已经沉淀了一系列硬件、操作系统、生态伙伴等资源,万事俱备的情况下,也紧抓这一波AI眼镜热潮,推出了兼具AI视觉感知和AR显示技术的Rokid Glasses。
具体来说,Rokid Glasses通过绿色 Micro-LED 衍射光波导方案,在镜片上显示绿色UI和文字。同时集成了阿里巴巴旗下通义千问大模型,具备物体识别、文字翻译、数学题解答、AI实时导航等功能。Rokid也在系统和算法层面做了大量工作,实现了软硬件的深度结合与协同,让大模型在AI眼镜上提供更加流畅和稳定的体验。
第二条,全彩显示的“AI+AR眼镜”。
此前,AR眼镜已经在探索几何光波导+LCoS全彩微显示屏方案。这类方案的特点是高分辨率、色彩鲜艳,能够与现实世界无缝融合,带来更加沉浸式的视觉感受。比起第一种AI眼镜的简单显示,这一方案与AI大模型相结合,能够打造出更科幻的体验感。
代表产品是meta的Orion,区别于与雷朋合作的AI眼镜Ray-Ban meta,Orion采用神经腕带与智能眼镜进行手势互动,通过多种手势识别操作各类AI应用、虚拟相册等。
全彩显示技术与人机交互的挑战,目前来看尚未完全解决。比如Orion的显示效果,清晰度和距离仍然很难平衡,拉远放大之后的清晰度就会下降,影响视觉观感。而手势交互方式,算法识别率仍不稳定,且需要较高的学习成本,除了刚需的高频场景,不然用户很难有耐心坚持使用。
第三条,XR显示设备+系统级AI。
以苹果Vision Pro为代表,将XR混合现实设备与AI相结合,带来颠覆性的空间智能体验,是目前智能眼镜品类中最具科幻感的一个。但问世以来,重量大(是方案1眼镜重量的十倍)、易疲劳(佩戴30分钟以上出现晕眩、眼疲劳)、使用频率低(用户少,缺乏黏性应用)、价格高(3499美元)等问题,也都使其局限在极客、科技博主等小众圈子,始终没能走进大众消费市场。有消息透露,苹果正在研发类似路线一的AI+AR类眼镜。
目前来看,经过了一段时间的群芳争艳,大模型+智能眼镜的主流形态正在稳固下来,那就是兼顾了重量、功能、价格的路线一“AI眼镜”,正在吸引各大厂商加速布局,将是智能眼镜这一轮复兴的主要形态。
新硬件的产品形态稳定下来,大量科技企业、垂类企业甚至白牌代工厂都想参与进来,就会进入到百花齐放阶段,推动市场的爆发式增长。AI眼镜,大概率会重现智能手机领域的“千元机时刻”。
2014年,智能手机迎来了自己的“千元机时刻”。4G网络开始普及,直板触屏智能手机的形态稳固,供应链趋于成熟,更多消费者希望买到高性价比的智能手机,由此催生了一个巨大的空白市场。无数品牌正规军跃跃欲试,进入白热化竞争阶段,将山寨机清理出市场,智能手机由此开启了规模化普及。
AI眼镜,也来到了“千元机时刻”的前夜。
一方面,市场需求与接受度有了颠覆式变化。大模型彻底重塑了智能眼镜的实用性和功能性,实时AI翻译、语音通话、AIGC、视觉理解等能力被部署到AI眼镜,可以取代部分智能手机的功能,产品力走向消费级拐点。
此外,传统智能终端如手机、平板、PC的格局已经很难撼动,很多中小厂商和开发者的创造力被释放出来,智能眼镜提供了技术创新和差异化竞争的机会。就像千元机时代品牌百花齐放一样,AI眼镜的产品丰富度会进一步提高,通过独特功能和模型精调优化的产品,可以满足消费者的不同需求。