当今时代,健康已成为人们生活中最为关注的核心议题之一。从日常的健康管理到疾病的早期筛查与精准治疗,除了传统的医疗服务,通过更先进的技术手段,实现高效、精准且个性化的健康管理来满足大家对医疗健康服务的需求已经不是不可能。比如说 AI,就为这种需求的满足带来了前所未有的变革机遇。
而就在最近,讯飞医疗基于星火 X1 首发的星火医疗大模型 X1,就让我们看到了通过 AI 为每个人带来个性化健康管理和医疗咨询服务的可能。
我们知道,当前生成式 AI 行业正在从 AI 训练向大规模推理和应用转型,DeepSeek 今年以来的火热出圈就是很好的例证。而大规模推理模型和健康医疗领域的结合,自然也很令人期待。
具体来说,大家现在打开讯飞晓医 App,就能看到晓医已经正式上线了“星火医疗大模型 X1”,该模型进一步提升了多步循证推理能力,为用户提供更加个性化、更专业、更实用的健康咨询服务。
讯飞晓医,是科大讯飞推出的首款面向居民提供的 AI 健康助手应用,它依托讯飞星火医疗大模型亿级高质量权威医学知识数据库,可以为大家提供症状自查、药物查询、报告解读和个性化健康档案管理等一系列医疗健康服务。
那么,有了星火医疗大模型 X1 加持的讯飞晓医如今体验如何呢,今天大家不妨就和一同来通过实际体验了解一下。
一、深度分析能力测试
对于普通消费者来说,当我们使用 AI 来辅助健康管理和咨询医疗相关的信息时,最看重的自然就是 AI 模型的专业性,也就是它给我们的信息是否专业、可信。其次,集成这样的 AI 能力的产品应该好用、实用,能够真正给我们带来切实可行的医疗建议。
不仅如此,我们还需要 AI 能够更懂我们,了解我们长线的健康状况,从而能针对我们每个人提供个性化的服务。
这些应该是我们评判一段大模型在健康医疗方面服务能力时需要重点关注的点。
接下来,我们不妨通过一些问题来进行测试,看看他们在面对一些医疗和健康问题时会有怎样的表现。
测试前需要说明的是,小编会分别在开启和关闭星火医疗大模型 X1(以下简称“大模型 X1”)的情况下进行测试,从而让大家可以更直观地感受到大模型 X1 能够对讯飞晓医寻医问诊体验带来的变化。
首先,小编问了一个问题:血栓患者吃利伐沙班的药一年了,能长期吃吗?对身体有什么影响?
在开启星火医疗大模型 X1 的情况下,讯飞晓医回答这个问题耗时 15 秒,在回答时展现出详细的思考过程,先查看了我提交的病史档案,然后分析利伐沙班药物药理,接着结合药理和我的病史和用药史先后分析了药物相互作用的问题和长期用药的问题,整个逻辑链条是比较通顺的。
而给出的回答条理也很清晰,先后给出了利伐沙班的适应症和疗程、长期使用的风险监测等信息,我在问题中没有提到药物相互作用的考虑,它也主动给出了相关参考建议。不仅如此,讯飞晓医还针对我的个体情况给出了针对性的血栓治疗建议,考虑到了我病史中高血脂和脂肪肝的风险因素。此外,还主动给出了日常管理建议。
可以看到,讯飞晓医给出的回答在专业性和实用性上都很强,同时让人惊艳的是它完整全面的逻辑思考,将我问题中提到的和没提到的因素都考虑到了,并给出了相应的医学建议。
另外值得一提的是,通过这个问题,讯飞晓医识别到我可能患有血栓,还主动建议我添加到既往病史中以完善健康档案,这一点很细节。
然后小编把大模型 X1 关闭,同样的问题再问一遍。
这一次,讯飞晓医并没有展现出细致的思考推理过程,而是结合我的档案和 2 篇医学知识,给出了两个方面的参考信息,首先是利伐沙班可以长期服用的特定情况,这个过程并没有特别针对我个体的情况细致分析,其次,晓医列出了长期服用利伐沙班对身体可能产生的影响,总体来说都是偏知识性的回答,尽管答案都是正确的,也具有不错的参考价值,但整体实用性、个性化方面确实不如开启大模型 X1 时的回答。
接下来,小编问了第二个问题:我几天来偶尔出现头晕,但没有伴随旋转感、恶心、呕吐、视力模糊或走路不稳等其他症状,请问如何缓解头晕症状?
这一次我们先不开启大模型 X1,可以看到晓医主要是参考了丁香医生的一篇医学知识,提示头晕可能是由低血压、贫血、耳内平衡器官等问题造成,同时结合我描述的病症给出了生活调理、物理治疗和药物治疗三方面的改善建议。可以说具有一定的参考价值。
然后,小编开启大模型 X1。这一次,讯飞晓医结合我的病史、手术史等情况做了详细分析,在回答中考虑到了小编高血脂、脂肪肝可能间接带来的头晕症状。在缓解性建议中,也是结合我自身的情况给出了针对性的建议,比如提醒我少吃高油脂、动物内脏等食物,控制血脂。
此外晓医给给出了医学监测和干预的建议以及药物缓解的建议,特别是就医指征中提示若出现头痛、言语不清徐排出脑血管问题,还建议完善颈动脉超声排查血管狭窄,心电图检查排查心率失常,这些建议都是非常具体可操作且很明确的,实用性很高,通常情况下,我们去医院,一般也会先做这些检查以逐步排除病因。
然后,小编又询问了一个问题:手部脚腕部出现极痒疹子,越挠越痒,5,6 天后渐老化,但会留下一个小硬包,已有半个月了,什么原因?怎么办?
在开启大模型 X1 的情况下,你可以看到讯飞晓医在思考中是如何根据小编的病史情况和问题中描述的症状一步步排除各种因素,分析可能导致手部出现疹子的原因的,整个过程思路很是清晰,而在处理建议方面,也考虑了各种适合或者不适合的处理方式。
最后给出的回答中,首先列出了对小编这个个体情况来说最可能导致起疹的诱因,处理方案中,也列出了急性止痒、外用药物、生活方式干预等三种类别下各自具体可操作的建议,还提示需要警惕的情况。另外讯飞晓医还针对我的高血脂和脂肪肝给出了需要特别注意的事项,以及药理上避免自行使用强效激素或偏方的建议。
关闭大模型 X1 再问一遍,这次讯飞晓医追问了一些关于病症的一些细节症状,包括起疹的详细部位、大小形状、是否做过相关检查等问题,小编需要一一做回答。
经过多轮问诊解答后,讯飞晓医也给出了准确的病因分析和处置建议,整体看起来和开启大模型 X1 时直接给出的分析结果也差不多,只是在回答中涉及的知识的全面性上相比开启大模型 X1 有所不足。
整体来说,如果说开启星火医疗大模型 X1 之前的讯飞晓医是一个知识渊博的人在根据现有的资料为你答疑解惑,那么开启大模型 X1 之后的讯飞晓医则更像是一个真实的私人医生在根据对你的了解来分析病症、给出健康管理的建议。
小编在体验的过程中,基本没遇到大模型医疗幻觉的问题,在回答复杂问题时,他也能像真实的医生那样逐步解释循证,因此在面对一些复杂问题时也展现出很高的逻辑正确性、专业性和可解释性。同时它还能读取你的健康档案,给出独属于你自己的、不是适用于所有人的答案,这一点也让讯飞晓医的实用性和可信赖性大大增强。
二、多模态解读报告单、医学影像能力测试
除了上面这些大家日常生活中可能会经常遇到的有关健康管理、寻医问诊的问题,还有一些痛点场景也很值得一说,就是很多人在体检之后拿到报告单,面对一些异常指标里的各种专业术语往往会不知所措,这时候就迫切需要一位专业的健康助手来答疑解惑。
那么 AI 是否能很好地担任这一角色呢,也做了一波测试。
首先,小编在讯飞晓医中上传了一张 PDF 体检报告单,然后讯飞晓医就可以直接帮我进行报告解读。
解读完成后,可以看到讯飞晓医给出的解读内容非常丰富,先是在总体评估中准确判断出报告中纯在的各项异常指标,然后又针对每一项异常指标进行医学原理解读和就医指导,在就医指导中又根据异常项目的严重情况区分了“立即就诊”、“定期复查”、“日常关注”三个类别,由于这部分内容很详细,小编截取其中片段供大家参考,不难发现呈现的方式很直观、细致,甚至指明了复查科室。
不仅如此,讯飞晓医还列出了根据这份报告的异常指标,给出了报告主体在日常生活中需要关注饮食和运动方面的建议。整体来说非常专业、详尽。
另外,讯飞晓医还直接提供了找医院的选项,点开后能够看到我所在地附近可以去的医院,小编看了一下,都是本地评价比较好的医院。
用讯飞晓医测试完之后,也很好奇,目前另外两个比较热门的大模型 DeepSeek 和 GPT-o1 会有怎样的表现呢?于是又把同样的问题抛给 DeepSeek 和 GPT-o1,来进行一波对比。
首先是 DeepSeek,它给出的解读结果要简单不少,不过核心的异常指标也都提炼了出来,也有对应的健康管理建议,整体上专业性上还是不如讯飞晓医。
GPT-o1 方面,结果和 DeepSeek 比较类似,异常项目判断的是比较全的,也有简单的应对建议,但整体来说还是讯飞晓医更专业和详尽。
很多时候我们拿到的报告单可能不止一份,而且彼此是有关联的,这时候讯飞晓医能不能同时解读两张报告单并进行分析呢?小编也做了测试。
测试时,小编将一份血液常规报告单连同当时做的腹部 B 超影像一起交给讯飞晓医进行解读。可以看到,讯飞晓医不仅清楚列出了血液检测中的异常项目,也识别出腹部 B 超报告中存在中度脂肪肝、胆囊多发结石的问题。讯飞晓医还列出了 4 条应对建议,每一条都是针对异常项目的,其中还包括针对我个人的脂肪肝病史给出了专门的建议,很实用,可以让我们更有方向地了解报告内容,便于进一步就医问诊。
接着,小编也用 DeepSeek 做了测试,同样的问题给 DeepSeek,可以看到 DeepSeek 将正常项目和异常项目混在一起,看起来不够清晰直观,也不能结合本人的病史档案进行分析,整体来说属于比较机械的解读,虽然没有错误,但实用性稍低一些。
再看 GPT-o1,这次 GPT-o1 给出的解读能直接找出报告中的异常项目,相对来说实用性比 DeepSeek 要好一些,也有针对异常项目的应对建议,和 DeepSeek 相比属于是差不多的水平。
接下来,小编在自己最近一次血常规检测中找到两项异常指标,让讯飞晓医分析一下这两项指标异常意味着什么。
在讯飞晓医的回答中,对这两项异常指标都做了比较专业的解读,结合小编报告单中医生给出的解释,讯飞晓医的回答都是正确的,这说明讯飞晓医确实具有出色的专业性。
DeepSeek 方面,给出的回答也是比较专业且全面的,同时也有针对性的应对建议。
最后,小编上传了两年间不同时间拍摄的两张甲状腺彩超报告单照片,考验大模型能否根据多报告单进行时序对比解读。
讯飞晓医面对这两张照片,直接帮我将报告单中的照片的相关医学指标整理成了一份图表,指标情况的变化一目了然,这一点好评。当然,它给出的判断分析也是准确的,甲状腺左叶低回声结节有所增大,但恶性风险较低,同时给出了定期复查的建议,以及提醒关注血脂和脂肪肝的情况。
DeepSeek 的回答虽然不那么直观,但整体上也是没问题的。
整体来说可以看到,在多模态解读报告单、医学影像方面,讯飞晓医的表现依然是非常专业且实用的,并且给出的建议也能够根据用户自己的健康档案做到个性化、有针对性。DeepSeek 在这方面有着相似的专业性和实用性,但在部分场景下的回答还是略微不够清晰明了,并且也不能根据用户以往病史进行个性化分析。但总体来说,讯飞晓医和 DeepSeek 的表现都是明显优于 GPT-o1 的。
当然,除了对报告单、医学影像的解读,作为一款专门针对医疗场景的健康助手应用,讯飞晓医还是利用 AI 大模型能力围绕医疗场景做了一些更细化、更独特的功能体验。比如在拍一拍中,你可以通过拍药盒来让讯飞晓医来给你用药建议。
这里小编用自己之前起荨麻疹时医生开的两种药来对其进行测试,同时拍下两个药盒,当小编说出胳膊起疹时,“讯飞晓医”初步判断为荨麻疹,然后给出了荨麻疹的相关科普以及用药建议,在用药建议中能看到这两个药可以一起吃,这和医生开出来的结果也是一样的。
再比如讯飞晓医还有个性化的健康空间,这里汇总了你上传的所有病历、报告单、使用的药物和体检报告等信息,同时你还可以在这里完善你的健康史、包括既往病史、个人吸烟和饮酒情况以及家族病史等,这些都会成为你向讯飞晓医咨询时重要的参考信息。
不仅如此,讯飞晓医还会根据你填写的健康史信息主动帮你生成一份饮食建议,比如小编有高脂血症、脂肪肝,它就帮我生成了对应的健康饮食计划,早餐、午餐、晚餐适合吃什么都安排得好好的。当然,除了饮食计划,讯飞晓医还可以给你提供对应的运动建议,包括适合的运动、运动中需要注意的事项等等。
你还可以为你的家庭成员建立健康档案,所有的这些功能也都适用于家庭成员。这些都是 DeepSeek 等通用类大模型产品所无法提供的,可见,讯飞晓医确实是更适合普通用户的 AI 健康助手。
结语
通过上面的一系列体验和测试,相信大家已经能够发现,在引入星火医疗大模型 X1 后,讯飞晓医首先是和自己相比,在面对健康医疗问题时整个应对的专业性、逻辑性和完善性都有了质的提升,这也是推理模型为讯飞晓医带来的新能力。
而对比 DeepSeek、GPT-o1 这样的明星推理大模型产品,讯飞晓医在健康医疗领域也展现出了足够强的竞争力,和 DeepSeek 相比在很多细节回答上表现更优,对比 GPT-o1 则有比较明显的优势。
同时小编要着重强调的是,得益于构建个人数字健康空间的能力,讯飞晓医能够结合你和家人的健康档案提供针对性的健康建议,从而让讯飞晓医的个性化和实用性大大增强。
而像 DeepSeek / GPT-o1 等由于是通用模型,给出的回答自然也是面向所有用户的,缺乏针对性,不仅如此,在更多的医疗细节场景需求上也不太能满足,比如主动帮你制定健康饮食、运动计划等等。
升级后的讯飞晓医使用久了,你会觉得他好像就是一个懂你的私人健康管家,能掌握你的健康状况,帮你解决医疗上的一些问题,并给出可行的建议。普通人平时有个头疼脑热的小毛病,如果只想要网上搜一搜了解身体状况的时候,不妨用更实用更靠谱的健康 AI 助手讯飞晓医。当然,同时也需要说明的是,目前 AI 给出的信息终究也只起到辅助参考的作用,它能够为我们应对健康问题时提供便利,但讯飞晓医不能代替医生,医生的临床经验还是至关重要哦,建议大家以医生的建议为准。