AI+AR 在改变一切。这是走出 Rokid 新品发布会会场后我最深的一个感触。在刚刚发布的 Rokid Glasses 上,AI+AR 成了我们真正与世界交互的一种方式,一种更好的方式。
当梦想照进现实,很多人的第一反应可能是难以置信。但事实毕竟发生在眼前了。
11 月 18 日,杭州。在 Rokid Jungle 2024 合作伙伴暨新品发布会上,Rokid 正式发布了与BOLON眼镜联名的新一代 AR 眼镜——Rokid Glasses。
一如之前预料,Rokid Glasses 惊艳了所有人。在 Rokid Glasses 上,我们不仅看到了 AI 全方位融入带来的功能和体验升级,还有高度集成的无线一体化设计,将主板、电池以及光学显示模组等核心组件集眼镜于一身。
更重要的是这些都在与传统眼镜几乎无异的形态下实现了。再加之与知名时尚眼镜品牌BOLON眼镜共同打造的时尚设计,以及仅仅 49g 的眼镜重量,意味着 AI 与 AR 技术的平民化,普通人都可以在日常生活中佩戴和使用它,就像你平时戴眼镜一样。
与此同时,具备显示能力的 Rokid Glasses 也给到了一个非常有诚意的定价:2499元。按照规划,Rokid Glasses 将于明年第二季度正式开售。
包括我在内,很多人一直相信在个人电脑和智能手机之后,数字世界和物理世界必然将从分离走向融合,而人机交互的未来就在融合二者的 AR 眼镜上。但我们也清楚,技术的每一次演进,都需要解决无数的实际问题。就像曾经的智能手机一样,从概念到普及的过程充满荆棘。
毕竟,想象和预测未来从来不是最难的,最难的始终是创造未来。
唯一的不同,就是处处不同
最简单,也能体现Rokid Glasses 不同之处就是提词器功能。无论是进行演讲、主持,还是录制视频,用户只需要佩戴 Rokid Glasses 就可以在视野中看到提词内容,不需要额外设备和调试就满足需求。
但提词器仅仅是个开始,基于 AI 与 AR 的深度融合,Rokid Glasses 带来的是更多日常的可能性。
想象一下,无论是因为商务出差还是旅行探亲来到异国他乡,语言障碍是经常要面对的一大难题,你可能需要搞懂一块路牌上的信息,或者坐在餐馆里拿着一份全是外语的菜单。此时,Rokid Glasses 可以通过 AI 的视觉感知并进行翻译,同时直接在你的眼前呈现翻译后的信息,不需要担心在餐馆嘈杂的环境中听不清语音,也不用怕记不清需要重复翻译、听取。
这种变化在导航场景中体现得更为淋漓尽致。Rokid Glasses 支持 AI 实时导航,不管是日常骑行还是漫步在一座陌生城市,都能简单一句话让 AI 进行导航,并在眼前的真实世界中给出精准的方向指引,同时在耳边实时播报路况信息。
一言以蔽之,Rokid Glasses 通过 AR 的方式把 AI 的能力带到耳边,带到眼前,也让人类的感官得到了史无前例地扩展和延伸。
与过去所谓的「智能眼镜」相比,如果说今天智能眼镜有什么根本的变化,那一定离不开大模型带来的「智能进化」,尤其是 AI 更强大的自然语言理解和多模态能力,让语音交互真正变得可用和好用。这种变化更体现在 Rokid Glasses 上。
通过深度整合多模态大模型,Rokid Glasses 不仅能实现自然流畅的 AI 语音交互,还能利用眼镜上的摄像头,让 AI 通过视觉感知周围环境,基于真实世界进行 AI 聊天问答、物体识别以及拍照答题等体验。
但纯语音交互始终存在局限性,作为信息传递的一种方式,语音在效率和精确性上也远不如视觉。而这,也更进一步凸显了 AR 眼镜的重要性和必然性。
作为一家专注人机交互技术的产品平台公司,Rokid 相比其他厂商显然更清楚这一点,不只是加入了头动接听/拒接电话的巧妙设计。更重要的是,作为新一代 AR 眼镜,Rokid Glasses 的核心是在视觉交互层面同时支持 AI 视觉感知(输入)和 AR 显示(输出),相比其他智能眼镜在体验上有质的区别。
而这些质的区别,离不开 AI,也离不开 AR 显示能力的支撑。想象一下,如果仅依赖语音或听觉,导航信息如何精准传递?翻译内容如何直观呈现?但在 Rokid Glasses 上,基于视觉的交互刷新这些场景下的体验,用「所见即所得」的方式让信息传递更高效、更自然。
大量研究也都证明,人类超过 80%的信息是通过视觉来获取,这就更加说明,AR 眼镜是 AI 最理想的载体——它不仅能听,还能看,更能用看得见的方式沟通复杂的信息。
与此相对,Rokid Glasses 所展现出能力和潜力,理所当然也吸引了那些不同领域,但同样创新驱动的科技公司,包括钉钉、爱奇艺、哔哩哔哩、淘宝以及智象未来等知名科技公司都作为 Rokid 的合作伙伴出现在 Rokid Glasses 的发布现场。
尤其我们看到了,Rokid Glasses 通过接入支小宝,可以实现一句话就能打车,并且基于声纹识别实现支付宝支付,让 Rokid Glasses 的日常使用场景进一步得到了扩展。
而在背后,既是这些创新公司看到了 AI+AR 在人机交互上的深刻变革,另一方面也是看到了 Rokid 在其中扮演的关键角色,尤其是在 Rokid Glasses 上。
一款真正日常的 AR 眼镜,到底难在哪里?
时至今日,AR 眼镜已经有了一定的用户认知,但如何把「用户认知」真正转化为「用户习惯」,或者说实现 AR 眼镜的「日常化」,一直是极具挑战的命题:它必须轻若无物,却又要功能强大;它要拥有眼镜的自然外形,却能装下未来科技的所有可能性。
Rokid Glasses 的出现,似乎给了这个问题一个答案——仅重 49 克的轻巧佩戴体验、无线一体化的设计,还有高通第一代骁龙 AR1 芯片的加持,同时实现了 10 分钟充入电量至 90%,20 分钟就能充满。眼镜盒还能提供多达 10 次的充电能力,让 Rokid Glasses 能够深度融合 AI+AR 技术的同时,还是一副真正适合日常佩戴和使用的 AR 眼镜。
特别是在佩戴,这次 Rokid 联合知名时尚眼镜品牌BOLON眼镜,将传统眼镜的舒适性和美学设计融入到 Rokid Glasses 中,使其外观看起来与一副传统的时尚眼镜无异,你可以轻松戴着它走在街上。
然而,这种看似简单的设计,却是无数次打磨和技术积累的结果。要让 AR 眼镜成为日常佩戴的一部分,需要从光学显示技术到软硬件的深度结合,才能最大限度发挥 AI 的能力,实现更好的 AR 体验。这也是最难的地方。
首先要明确一点,AR 眼镜的本质是将数字世界与物理世界进行融合,所以必须透过镜片既能看到真实环境,又能显示虚拟内容。在这条路上,Rokid Glasses 通过玻璃衍射光波导技术,在超薄的镜片内实现了虚拟内容在真实环境中自然呈现,而不是让用户感受到割裂感。
与此同时,AR 眼镜需要在「螺蛳壳里做道场」,但在极其有限的空间内实现强大的功能和体验,最核心的就是软硬件的深度结合与协同。
为了让 AI+AR 的能力最大化地发挥作用,Rokid 在系统和算法层面就做了大量工作,不断迭代和改进自研空间操作系统 YodaOS-Master,让硬件资源能够得到极致地利用:在 Rokid AR Lite 实现的三联屏高效体验,在 Rokid AR Studio 上通过单目摄像头做到精准地空间定位与手势识别。
而在 Rokid Glasses 日常化的设计背后,正是过去十年 Rokid 在 AI+AR 的技术积累和创新能力的一次爆发。
当然,Rokid Glasses 要成为一款真正面向日常的产品,关键还在于对用户需求的深刻理解以及强大的生态。Rokid 对此的答案就是:既要向下深耕技术,也要向上定义场景。
通过深度挖掘用户场景,Rokid 不仅实现了 AI 实时导航、多语言翻译等功能,还吸引了众多合作伙伴共建生态:与钉钉的合作为 AR 办公开辟了新的可能,与淘宝一起将 AR 引入了在线购物体验,还与智象未来在 AR 设备上实现了 AI 生成 3D 内容。
从用户的角度,这些合作在不断丰富 Rokid AR 眼镜的使用场景。而从行业的角度来看,这些合作不仅在帮助 AR 眼镜真正融入了用户的日常生活,也在构建一个面向现在和未来的 AR 范式。
十年,一个开始的结束
十年前的 2014 年,被谷歌眼镜点燃梦想火苗的 Misa 成立了 Rokid。从那时算起,过去十年 AR 行业经历了数次起起落落。但每一次退潮后的涨潮,都又一次验证了 AR 技术顽强的生命力。
与此同时,Rokid 以及整个行业对 AR 技术始终在探索和迭代,思考 AR 对于消费者的价值,也能看到 AR 正在逐渐被认知和接受。
十年后的今天,Rokid Glasses 让很多人对 AR 眼镜的梦想走进了现实:轻巧到可以像普通眼镜一样全天候佩戴,又强大到可以将数字内容融入现实空间。可以说,相比五年前的第一代产品 Rokid Glass,Rokid Glasses 成为了一副真正为所有人打造的 AR 眼镜。
但就像丘吉尔的那句话,「这不是结束,甚至这不是结束的开始,而是开始的结束。」从 Rokid Glass 到 Rokid Glasses,这是一个阶段的结束,也是下一个阶段的起点。
凯文·凯利(Kevin Kelly)在他新作《5000 天后的世界》中写到,「我们即将迎来崭新的巨大平台,世界万物都和 AI 相连。数字世界和现实世界完美融合,这就是我们所说的 AR 或者镜像世界的新平台。」
轻量化、舒适的佩戴体验,强大的 AI+AR 能力,这些都让 Rokid Glasses 成为加速数字世界与物理世界融合的桥梁。而 Rokid 已经站在新的路口,准备好在未来十年继续将梦想照进现实,为 AR 技术写下新的篇章。