当前位置：首页 » 资讯 » 新科技 » 正文

研究：训练数据含 0.001% 的错误信息足以“毒害”医学 AI 模型

IP属地北京 编辑：赵云飞 IT之家 时间：2025-01-14 17:32:01

1 月 14 日消息，纽约大学的一项研究揭示了大型语言模型（LLM）在医学信息训练中的潜在风险。研究表明，即使训练数据中仅含有 0.001% 的错误信息，也可能导致模型输出不准确的医学答案。
数据“投毒”是一个相对简单的概念。LLM 通常通过大量文本进行训练，这些文本大多来自互联网。通过在训练数据中注入特定信息，可以使模型在生成答案时将这些信息视为事实。这种方法甚至不需要直接访问 LLM 本身，只需将目标信息发布到互联网上，便可能被纳入训练数据中。例如，一家制药公司只需发布几份针对性文件，便可能影响模型对某种药物的认知。
据了解，研究团队选择了一个常用于 LLM 训练的数据库“The Pile”作为研究对象。该数据库包含大量医学信息，其中约四分之一的来源未经人工审核，主要来自互联网爬取。研究人员在三个医学领域（普通医学、神经外科和药物）中选择了 60 个主题，并在“The Pile”中植入了由 GPT-3.5 生成的“高质量”医学错误信息。结果显示，即使仅替换 0.5% 至 1% 的相关信息，训练出的模型在这些主题上生成错误信息的概率也显著增加，且这些错误信息还会影响其他医学主题。
研究人员进一步探讨了错误信息的最低影响门槛。以疫苗错误信息为例，即使错误信息仅占训练数据的 0.01%，模型生成的答案中就有超过 10% 包含错误信息；当错误信息比例降至 0.001% 时，仍有超过 7% 的答案是有害的。研究人员指出，针对拥有 700 亿参数的 LLaMA 2 模型进行类似攻击，仅需生成 4 万篇文章（成本低于 100 美元）便可。这些“文章”可以是普通的网页，可以把错误信息放置在网页中不会被正常浏览到的区域，甚至可以通过隐藏文本（如黑色背景上的黑色文字）来实现。
研究还指出，现有的错误信息问题同样不容忽视。许多非专业人士倾向于从通用 LLM 中获取医学信息，而这些模型通常基于整个互联网进行训练，其中包含大量未经审核的错误信息。研究人员设计了一种算法，能够识别 LLM 输出中的医学术语，并与经过验证的生物医学知识图谱进行交叉引用，从而标记出无法验证的短语。虽然这种方法未能捕捉所有医学错误信息，但成功标记了其中大部分内容。
然而，即使是最好的医学数据库（如 PubMed）也存在错误信息问题。医学研究文献中充斥着未能实现的理论和已被淘汰的治疗方法。
研究表明，即使依赖最优质的医学数据库，也无法保证训练出的 LLM 完全免受错误信息的影响。医学领域的复杂性使得打造一个始终可靠的医学 LLM 变得尤为困难。

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

一夜之间外国人大量涌入小红书，想不明白国人骄傲什么劲

雷军周鸿祎再赴“互联网圈春晚”，下一个“新手村张一鸣”也在现场吗？

第十届“ME计划”资助仪式在京举行

市场活跃度降低，但也可能是市场拐点临近的信号

小红书遭遇泼天流量，一夜之间国际化？

Tiktok“难民”扎堆涌入小红书还有哪些APP能接住这“泼天流量”

锚定视听新体验，实现应用新增长，华为举办鸿蒙生态视听行业峰会

OpenAI的o1模型推理时蹦出中文专家猜：AI可能只想用最高效的语言来思考

华为举办鸿蒙生态视听行业峰会，携手伙伴共探视听新体验、新增长

马斯克：AI训练去年就已耗尽现实世界的所有资料

科氪｜酷睿Ultra 200H AI PC全球首发携手华硕灵耀两款新机登场，AI PC新纪元！

不妨从四方面规范高频交易

A股午评：创业板指涨2.68% 超5200股上涨！小红书概念、机器人概念领涨

图个“百财”好彩头，有券商营业部别出心裁给客户送白菜！开门红各有新打法

小摩“二号人物”宣布退休计划市场最关心的问题还没有着落……

Tiktok“难民”扎堆涌入小红书还有哪些APP能接住这“泼天流量”

董明珠力挺以旧换新：10年前空调一年多花1000元电费

12306回应候补人数多或增加车次：会根据需求情况适当安排

2024年或巨亏14亿，“胖改”永辉的含金量待考

《王者荣耀》原生鸿蒙限量付费删档测试结束：充值点券可返还

199元！华硕发布鹅卵石10Gbps硬盘盒：不怕淋雨泼水

英国央行：关于是否推出数字英镑的决定将至少推迟两年作出

药明康德股价回暖多头反“撤退”？前三季度业绩下滑，出售资产回笼资金

达州电商新风尚，互联网赋能产业腾飞

大量的TikTok网红涌入小红书，你怎么看？

2025前端首战，写Vue的都是精神病，Vue祖师爷都来了

三星智能穿戴产品Galaxy Ring新增16项功能支持健康管理

全站最新

广州动力电池研讨会：聚焦技术前沿，共绘绿色出行新篇章

一夜之间外国人大量涌入小红书，想不明白国人骄傲什么劲

探索行业发展新路径，2025湖南定制家居行业发展峰会举行

雷军周鸿祎再赴“互联网圈春晚”，下一个“新手村张一鸣”也在现场吗？

预计亏损14亿元，5次提及“调改”！永辉超市经营尚未明显改善

第十届“ME计划”资助仪式在京举行

市场活跃度降低，但也可能是市场拐点临近的信号

小红书遭遇泼天流量，一夜之间国际化？

热门推荐

一夜之间外国人大量涌入小红书，想不明白国人骄傲什么劲

雷军周鸿祎再赴“互联网圈春晚”，下一个“新手村张一鸣”也在现场吗？

第十届“ME计划”资助仪式在京举行

市场活跃度降低，但也可能是市场拐点临近的信号

小红书遭遇泼天流量，一夜之间国际化？

Tiktok“难民”扎堆涌入小红书还有哪些APP能接住这“泼天流量”

锚定视听新体验，实现应用新增长，华为举办鸿蒙生态视听行业峰会

OpenAI的o1模型推理时蹦出中文专家猜：AI可能只想用最高效的语言来思考

华为举办鸿蒙生态视听行业峰会，携手伙伴共探视听新体验、新增长

马斯克：AI训练去年就已耗尽现实世界的所有资料

科氪｜酷睿Ultra 200H AI PC全球首发携手华硕灵耀两款新机登场，AI PC新纪元！

不妨从四方面规范高频交易

A股午评：创业板指涨2.68% 超5200股上涨！小红书概念、机器人概念领涨

图个“百财”好彩头，有券商营业部别出心裁给客户送白菜！开门红各有新打法

小摩“二号人物”宣布退休计划市场最关心的问题还没有着落……