当前位置: 首页 » 资讯 » 新科技 » 正文

中国联通:DeepSeek洞察与大模型应用——人工智能技术发展与应用实践

IP属地 北京 编辑:江紫萱 智能交通技术 时间:2025-03-20 15:00:21

该文档围绕人工智能技术发展与应用实践展开,以 DeepSeek 大模型为核心,涵盖了其技术特点、应用场景、中美 AI 领域对比、主流大模型与工具等多方面内容,对大模型在各领域的应用进行了深入探讨。

DeepSeek 公司及模型

公司概况:2023 年 5 月成立,是幻方量化旗下大模型企业。幻方量化资金规模和管理费收入可观,为 DeepSeek 发展提供支持。

模型版本及性能:V3 于 2024 年 12 月推出,对标 GPT-4o,基于 Transformer 架构,参数达 671B,训练成本低,多项评测成绩优异;R1 于 2025 年 1 月推出,对标 GPT-o1,在推理任务上性能出色,迅速出圈。R1-Zero 通过强化学习训练,R1 引入多阶段训练和冷启动数据解决其问题。

出圈原因及影响:性能卓越、训练开销低引发热议,改变了 AI 竞争格局,降低了行业门槛,加速千行百业融 AI 进程,冲击基础模型商业模式,促使市场竞争进入新阶段。

中美 AI 领域对比

人才与技术:中国高端人才数量和密度、重大原创性成果数量均落后于美国。

企业:中国头部高科技企业市值、AI 独角兽数量和估值低于美国。

GPU 芯片:美国企业在 GPU 芯片领域优势明显,国产芯片虽有进步,但在性能、产能等方面仍有差距。

头部大模型:中国在模型效果上与美国差距缩小,DeepSeek 成为效果最好的开源模型,引发美国担忧,美国拟出台法案限制中美 AI 技术合作。

主流大模型与 AI 工具

国内有深度求索、智谱等企业的大模型,以及联通、电信等运营商的模型;国外有 Google、OpenAI 等公司的模型。主流 AI 工具包括通用 AI 助手和其他类型工具,如 AI 搜索、情感陪伴、图片 / 视频生成工具等。

大模型应用场景

政务领域:联通数智联合打造的政务热线大模型,提升了工单处理效率和数据报告质量;经济运行大模型辅助政府经济决策。

公安领域:元景公安大模型试点应用,提升了视觉分析和检索效率,助力案件查办。

医疗领域:联通数智支撑打造的智慧医疗应用,为医护人员提供帮助,为医院工作提供新范式。

船舶设计领域:通过微调训练和技术优化,提升了大模型在船舶设计中的计算准确率和召回率,提高了设计效率。

大飞机装备运维领域:基于 RAG 的装备运维大模型,解决了长文本等复杂问题的问答挑战。

文博文创领域:元景文博文创大模型助力文创产品设计和文物活化展示,创新了文博场馆观展体验。

大模型使用建议

认识局限性:存在幻觉、算力消耗大、知识实时更新能力差、偏见及隐私安全等问题,用户应采取相应措施应对。

发挥优势:熟悉大模型回复特点,掌握提问技巧,以激发其创造力。

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。

全站最新