AI 硬件的风从年头吹到年尾,很多稀奇古怪的产品都已经被市场「证伪」,要么需求其实不存在,要么体验并没有更好。
相比之下,独立录音设备(比如录音笔)的需求其实一直存在,商务和媒体人士一直是这类产品的主要用户群体。尤其是大模型出现之后,AI 录音一下子解决了目标用户对「录音后」语音转写、录音总结、关键信息提取等需求。
所以也就不奇怪,今年上半年推出一款能贴在 iPhone 背面的「AI 卡片录音机」出圈后,初创公司 PLAUD.AI 在下半年很快又推出一款可穿戴设计的「AI 米粒录音机」——PLAUD NotePin(以下简称「NotePin」):
想要继续拿捏 AI 录音机。
图/
但当 AI 手机、AI 眼镜以及 AI 耳机等随身设备都开始广泛支持 AI 录音功能,我们真的还需要一台单独的 AI 录音机吗?在海淘并使用 NotePin 一段时间后,小雷有了一些新的看法。
一个「米粒」,四种佩戴模式
和之前卡片式的 PLAUD Note 一样,NotePin 功能非常简单,其实就是「录音」。包括在主体设计上也非常简单,看着就像没有屏幕的「米粒」——过去小米手环的主体设计。
正面除了 PLAUD 的 Logo 下隐藏了一个红色指示灯,还有一个收音孔用来收音,不过实际上在指示灯与收音孔中间,还有压力感应区,也是开关录音的唯一交互方式(在手机 APP 之外)。
而作为可穿戴产品,NotePin 一共有四种形态,但除了挂坠形态依赖顶部的挂绳设计,NotePin 的穿戴设计实质上都是以「磁吸」为基础进行设计。
图/
就连在手环形态下——看上去基本就是无屏小米手环,手环的表带都是依靠磁吸而非孔洞进行固定。
此外,NotePin 也能通过磁吸配件变成背夹形态,夹在衣服上,或者通过背夹磁吸模块吸附在衣服上。
图/
包括在充电设计上,采用触点充电方式的同时,充电底座加入了磁吸,好处是不太担心没对准,或是不小心触碰而导致没充上电。
有一说一,NotePin 主体以及配件的磁吸力度都足够大,正常蹦跳不会影响磁吸的稳定性,但又不至于真的夹伤手指。
图/
另一方面,磁吸设计也让 NotePin 在不同形态之间的切换更为方便,唯一比较费劲也就是手环形态的拆装,由于包裹主体的部分采用硬塑料的材料,而非过去小米手环采用的软塑胶,实际拆装需要一定的蛮力。
但用起来到底如何,可能才是大家最关心的。
被交互劝退,录音质量糟糕
如果说初上手,NotePin 给小雷留下的更多是「简约但不简单的设计」。那等真正开始用起来,首先就感受到了两个字:
难用。
前文就提到了,NotePin 主体的唯一功能就是录音,而启动和停止录音的核心交互就是按压正面中间的感应区:按下一次,机身震动,同时红色指示灯亮起,意味着开始录音;再按一次,机身震动,红色指示灯熄灭,意味着录音停止。
图/
坦白讲,这个交互在逻辑上没有问题,但俗话说「魔鬼藏在细节里」。首先是按压需要的力度远超预想,小雷也是各种尝试才发现必须用力重压才能触发启动,但即便如此,仍然有一定概率不会触发。
可以推想,NotePin 的产品团队初衷大概为了避免误启动,才把按压触发的力度阈值提高。但最后做出来的效果实在很难令人满意,需要拇指非常使劲才能启动或者停止录音。
而且不仅没有给予用户调节力度的选项,NotePin 在官网、APP 以及产品说明书上,也都没有提醒和引导用户注意这一点。实在不如放弃外观设计上的简约,采用物理按键设计。
另外还有反馈延迟。重按之后 NotePin 往往需要一会儿才能出现反馈(震动和指示灯),延迟可能接近甚至超过 1s,对于按压反馈来说很难接受。
而 NotePin 在交互设计上的粗糙,还体现在电量提示上。
众所周知,电量提醒对于可穿戴设备,尤其是无屏设备非常关键。在设计上,晃动 NotePin 会亮起正面指示灯,如果是白色意味着电量还算充足,紫色则意味着设备已经进入低电量。
但实际上,这个设计更多只是针对手环形态。小雷实测发现只有纵轴方向上的晃动,才能触发电量提醒,手环形态下自然转动手腕就能做到,但其他形态做起来就相当不自然。
图/
至于录音表现上,不出意外,NotePin 不管在硬件还是算法上都很难和旗舰手机(vivo X100 标准版)相较。尤其在相对嘈杂环境下,比如路口和餐馆,并不能相对清晰地录下人声,同时消噪表现也比较一般。
总而言之,NotePin 还是更适合比较安静的室内场景,比如会议室开会或者在家中,远达不到官网宣传的「随时准备捕捉一切」。
「GPT-4o」也救不了 NotePin
和很多今年的 AI 硬件一样,NotePin 虽然只有一个录音功能,但实际上更多的功能还在「后端」——APP 和云上。
简单来说,在 NotePin 上完成录音之后,录音文件会暂时存储在机身的存储芯片上,手机打开 PLAUD APP 后会自动同步录音文件,然后就可以利用云端的大模型进行转写、总结以及思维导图的生成。
图/
而 NotePin 的一大宣传卖点就是号称采用 OpenAI GPT-4o 模型,作为 Stater(初始)会员每月将有 300 分钟的转写时长,如果不够就要花费每月 6.58 美元(每年 79 美元)升级 Pro 会员,可以享受每月 1200 分钟的转写时长。
但不管是不是 GPT-4o,最终生成的转写结果实在差强人意,不仅录音中大段的对话被直接忽略,面对中英文夹杂、相对专业的数码科技词汇(比如 meta Orion、雷电 5)等方面的挑战也很一般。
同样一段录音,小雷也尝试通过 OpenAI 最新的语音转录模型 Whisper Large V3(Hugging Face 在线体验)以及阿里通义的音频转文字功能进行转录,虽然受限于 NotePin 的原始录音质量也有不少问题,但至少在遗漏、准确性方面都明显好过在 PLAUD APP 上的转录结果:
而且都免费。
坦白讲,到这里小雷已经看不懂 NotePin 的价值何在,录音交互难用,录音效果也一般,甚至全文转写的结果也难堪大任。到头来,NotePin 唯一的价值可能就是把录音同步到 APP 里。
当然这也建立在不错的待机和录音续航上,官方标称是可以连续录音 20 小时,至少小雷实测连续录音 12 小时绰绰有余,完全可以满足高强度录音后的集中同步。
图/
即便如此,小雷也不会向任何人推荐 NotePin。对绝大部分用户而言,今天的手机已经能够满足大部分的录音需求,没有单独配置录音设备的需要,NotePin 也完全不是为了随时记录灵感而设计。
而对专业用户来说,尽管可穿戴+磁吸配件的设计让 NotePin 变得更加灵活和容易触达,但糟糕的交互体验、一般的录音表现和模型转写效果,也很难满足这部分用户的实际需求。
基础体验不好,AI就是裸泳
过去将近一年的时间里,各种 AI 硬件可以说层出不穷,但时至今日其实也只有 AI 眼镜获得比较广泛的认可,尤其是 Ray-Ban meta 这款产品带来的范式。
在之前的报道中就多次提到,AI 眼镜是「先眼镜后 AI」。包括在豆包 Ola Friend 智能体耳机的评测中,我们也认为现阶段 AI 耳机要先做好耳机,再延伸 AI 的能力。
Ola Friend,图/
与眼镜、耳机相较,传统录音机是一个典型的利基市场(小众市场),有相对明确的用户群体以及较为小众的专业需求,也有更高的录音要求。而就目前来说,大模型带来的改变集中在「录音后」的阶段,省去了太多转写、总结、提取相关信息的繁杂工作。
反过来,这其实也更加要求硬件厂商要重视用户的基础体验以及录音质量,先做好一台录音机,才能做好一台 AI 录音机。推而广之,AI 硬件或许都存在这样一种准绳:
在已有产品形态上进行 AI 化,不是单纯以大模型为核心构建产品,而是从传统形态出发找到用户的根本需求,在充分借鉴传统形态(与解决方案)的同时,思考大模型技术能够在功能、交互上带来的扩展和进步。