当前位置: 首页 » 资讯 » 新科技 » 正文

这些「赛博格」正在用脑机接口重启人生:失语五年重新讲话,瘫痪患者用意念打游戏

IP属地 北京 编辑:任飞扬 AppSo 时间:2024-08-26 11:59:37

Casey Harrell 轻微地移动自己的嘴巴,发出难以辨析的声音。

他的第一道「题」是:

What good is that?(那有什么用?)

理想情况是,尝试讲出这句话时,Harrell 大脑产生的信号会通过脑机接口完成解码,在屏幕上打出这几个词语。

第一次尝试后,研究团队不得不把测试停下来。

Harrell 哭了,他的妻子兼照料者 Levana Saxon 哭了,BrainGate 研究团队哭了。

他第一次尝试就成功了。这是因「渐冻症(肌萎缩性脊髓侧索硬化症,简称 ALS)」而瘫痪并失去说话能力的 Harrell 在过去五年来第一次「说话」。

大家的情绪都很激动,测试不得不暂停一下。

无法沟通,为何是「痛中之痛」?

Casey Harrell

我感觉自己就像活在一场慢速播放的车祸之中。

Harrell 这样形容确诊渐冻症后的生活。

这个目前仍未找到治愈方法的疾病,会让患者失去对肌肉的控制能力,导致瘫痪、进食困难、失语,甚至无法控制呼吸所需的肌肉。

你知道自己会失去这一切,但你不知是何时。

那个感觉就是,我们完全不知道我们会在什么时候失去哪个肢体能力,特定能力又能保留多久。

我们真的就是某天突然醒来,就发现「这动不了了。从此这方面就要人帮助才行了。」

Harrell 的太太 Levana Saxon 说道。

Saxon、女儿 Aya 和 Harrell 在 2021 年的合照

和肢体瘫痪相比,让 Harrell 更崩溃的是失去了自己的沟通能力。

刚确诊时,也正好是两人女儿刚出生的时候。Harrell 最喜欢的就是给女儿唱歌,日间能随时现编滑稽的歌曲,描述着自己在做的事情,晚上则会唱着温柔的小夜曲,哄女儿睡觉。

然后突然有一天,他就唱不出歌了:

我失去沟通能力的过程非常漫长,最开始是失去给女儿唱歌的能力,然后开始要不断重复自己的话别人才能听懂,到后面必须要有专人为我翻译。

另一个让他们痛心的地方,在于朋友的消失。

你无法想象,有多少人因为不想目睹这场慢动作的车祸而远离我们。这发生在所有在面对绝症和慢性病的家庭。

人们希望你要不就好起来,要不就死。

在 Harrell 看来,这些人离开不是因为他们是坏人,只是他们不知道自己能做什么。

当你没法用语言和他们去聊这个问题时,情况就变得更糟糕了。

而留在身边的人,也因无法沟通而沮丧。

Saxon 表示,自己之前近乎每天都会让丈夫不舒服:

我会问他:「我可以移动你的手臂吗?」

然后我会以为他说的「可以」,但实际上他说的却是「不」。然后我就会移动他的手臂,导致全身痉挛。

Saxon 也没法请人协助照料 Harrell,因为没人能理解他的话。

「开箱即用」的技术,让他得以恢复全职工作

It just works.(它就是能用。)

这句话大家应该都不陌生。它常被用于形容设计直观易用的产品,开箱上手就能开用,没有繁复的使用说明。

没想到的是,今天这句话居然已经被用来形容脑机接口。

2023 年 7 月,Harrell 接受了时常长达 5 小时的手术,在其大脑的中央前回植入了 4 个 4x4mm 大小的平台。

这些跟 M&M 巧克力豆一般大小的设备每个有 64 个电极,合计有 256 个电极,比过往研究更多,这也意味着它将得收集到更多数据。

和所有脑机接口设备一样,除了植入大脑的传感器外,研究团队还需要解码器,用来解读传回的数据。

我们在之前的文章也介绍过,用脑机接口来构建语言对话能力有两种方式。

早期,这类技术多以「一个字母一个字母」的拼写式输出为主。

近年来,研究团队开始采用更「自然」的输出模式 —— 逐个完整单词地输出。

在这种模式下,算法会将单词拆分成更小的语音单位音素。譬如,单词「Hello」里就有四个音素:「HH」「AH」「L」和「OW」。

2023 年公布的两项采用这种算法的脑机接口研究中,参与者在开始使用前都需对系统进行较长时间训练,等于是让算法学习患者大脑电流模式。

当时,两位受试者的训练时间分别为几周和将近半年。

Pat Bennett 是 BrainGate 项目的上一位公布的受试者,她用了半年时间来训练系统

而 Harrell 这次,则只调试了大概半小时。

在这背后,团队在正式让 Harrell 启用脑机接口和解码算法前,先将算法放一个计算模拟上去测试练习,多了这一步后,「系统从第一天就能用起来」。

当屏幕上显示的词语的确是 Harrell 想说的,那他就可以完成确认,并用基于他失语前的声音素材训练出来的人声读出来,完成「说话」。

更振奋人心的是,除了能快速适应外,这套脑机接口的准确率也很出色。

经过两小时的使用,在高达 12.5 万词库的前提下,脑机接口输出的准确率依旧高达 90%。而在几天后,识别的准确率更是升高到 97%。

这个 97% 的准确率,不仅比过往类似研究(约 75%)要高,甚至比一些手机的语音输入文字识别率都要高。

不过,Harrell 语言的输出速度还是比平常语速慢,每分钟只可以说 33 个单词,低于平常语速 160 词/分钟。

它已经从一个科学研究展示变成了 Casey 每天可以用来和家人朋友说话的系统。

该项目负责人 David Brandman 说道。

对于 Harrell 而言,这个技术让他恢复了独立沟通的能力,他不再需要依赖专门的翻译或只能被误解。

他的太太 Saxon 表示,Harrell 现在开始重新和好朋友联系起来:

他们可以直接来到我们家,坐下来和他聊天。进行真正的,深入的对话。

尽管低于平常语速,但因为准确率较高,Harrell 因此开始在家里恢复了全职工作。

在患病前,Harrell 是一名气候活动家,在 NGO 担任高级策略师,主要工作是推动资产管理公司以投资的方式去投入环境保护。

更重要的是,现在 Harrell 也能重新和女儿沟通了。

差不多两年了,她都没有办法和我沟通。

现在,我可以帮助她妈妈去教导她。我可以和她建立一个更深的关系,告诉她我在想什么。

技术的「人性」

我是他们口中的高级用户(power user)。

每周下来,Harrell 使用脑机接口的时间长达 70 小时。值得庆幸是,这个技术在长时间运行下表现也不错。

我们在工程和测试上做了很多工作,也加入了很多小创新,才让它长时间运行时也能保持可靠。

BrainGate 项目成员 Nicholas Card 说道。

「虽然」现在 Harrell 可以「说话」了,但他还不「满足」,他想念唱歌。

每天「上机」时,他都要先用一些「测试句子」来看看设备是否表现正常。

这些时候,Harrell 脑里冒出的都是歌曲。最近,他很喜欢「唱」的是美国乐队 Chicago 的「If You Leave Me Now」:

If you leave me now, you will take away the biggest part of me.

BrainGate 也在努力尝试将音乐重新带回到他的生活里。

这些勇于承担风险的「先锋」,也在塑造着我们未来的技术。

Harrell 对唱歌的喜爱,在推动 BrainGate 在研究如何在算法中融入旋律的知识。

因闭锁综合症而失去对肌肉控制的 Ann Johnson,则是加州大学脑机接口项目的受试者。

通过和 Harrell 使用类似的技术,Johnson 也能将自己的话语通过屏幕播出。和 Harrell 不同的是,她的表达配合了数字化身,她的脑信号除了会变成文字,还会成为数字化身的表情。

同样对沟通有渴求的 Johnson,想要的不是唱歌,而是当咨询师,用自己康复的经验来帮助类似病人。

这种情况下,有表情有语音的表达起来会更自然。

今天,马斯克的脑机接口公司 Neuralink 公布了第二位受试者的情况。

Alex 也在用自己的方式使用脑机接口技术。

除了和第一位受试者 Noland Arbaugh 一样都喜欢玩游戏外,第二位受试者 Alex 原来是一位汽车检修员,喜欢建造东西。

Alex 在习惯脑机接口后,已经开始用 CAD 软件来设计物件,为自己的 Neuralink 充电器设计了一个支架,并真 3D 打印出来使用了。

无论是脑机接口还是 AI,它们都更像是「通用技术」,它们「进化的形态」,除了由研究人员支持外,经常也是由那些真正去使用它们的人塑造。

这些技术的「分支」背后,都是人类去连接和创造的欲望。

作者 | 方嘉文

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。

全站最新