该文档围绕人工智能技术发展与应用实践展开,以 DeepSeek 大模型为核心,涵盖了其技术特点、应用场景、中美 AI 领域对比、主流大模型与工具等多方面内容,对大模型在各领域的应用进行了深入探讨。
DeepSeek 公司及模型
公司概况:2023 年 5 月成立,是幻方量化旗下大模型企业。幻方量化资金规模和管理费收入可观,为 DeepSeek 发展提供支持。
模型版本及性能:V3 于 2024 年 12 月推出,对标 GPT-4o,基于 Transformer 架构,参数达 671B,训练成本低,多项评测成绩优异;R1 于 2025 年 1 月推出,对标 GPT-o1,在推理任务上性能出色,迅速出圈。R1-Zero 通过强化学习训练,R1 引入多阶段训练和冷启动数据解决其问题。
出圈原因及影响:性能卓越、训练开销低引发热议,改变了 AI 竞争格局,降低了行业门槛,加速千行百业融 AI 进程,冲击基础模型商业模式,促使市场竞争进入新阶段。
中美 AI 领域对比
人才与技术:中国高端人才数量和密度、重大原创性成果数量均落后于美国。
企业:中国头部高科技企业市值、AI 独角兽数量和估值低于美国。
GPU 芯片:美国企业在 GPU 芯片领域优势明显,国产芯片虽有进步,但在性能、产能等方面仍有差距。
头部大模型:中国在模型效果上与美国差距缩小,DeepSeek 成为效果最好的开源模型,引发美国担忧,美国拟出台法案限制中美 AI 技术合作。
主流大模型与 AI 工具
国内有深度求索、智谱等企业的大模型,以及联通、电信等运营商的模型;国外有 Google、OpenAI 等公司的模型。主流 AI 工具包括通用 AI 助手和其他类型工具,如 AI 搜索、情感陪伴、图片 / 视频生成工具等。
大模型应用场景
政务领域:联通数智联合打造的政务热线大模型,提升了工单处理效率和数据报告质量;经济运行大模型辅助政府经济决策。
公安领域:元景公安大模型试点应用,提升了视觉分析和检索效率,助力案件查办。
医疗领域:联通数智支撑打造的智慧医疗应用,为医护人员提供帮助,为医院工作提供新范式。
船舶设计领域:通过微调训练和技术优化,提升了大模型在船舶设计中的计算准确率和召回率,提高了设计效率。
大飞机装备运维领域:基于 RAG 的装备运维大模型,解决了长文本等复杂问题的问答挑战。
文博文创领域:元景文博文创大模型助力文创产品设计和文物活化展示,创新了文博场馆观展体验。
大模型使用建议
认识局限性:存在幻觉、算力消耗大、知识实时更新能力差、偏见及隐私安全等问题,用户应采取相应措施应对。
发挥优势:熟悉大模型回复特点,掌握提问技巧,以激发其创造力。