文|极光月狐数据研究院
DeepSeek成为了春节期间最炙热的话题之一,成为了继ChatGPT后又一现象级大模型。DeepSeek的出现对国内科技创新起到了振兴的作用,击碎了“AIGC初创企业难超车”的论调,也是以算法突破“算力霸权”的一重大胜利。DeepSeek之所以能够突出重围进入大众视线,主要在于其创新能力。
一、创新引领DeepSeek发展之路,单项能力赶超ChatGPT
DeepSeek的发展之路始于“百模大战”,彼时我国10亿参数规模以上的大模型已发布79个(科技部-《中国人工智能大模型地图研究报告》),正在寻找落地的应用场景,由此可见,DeepSeek起步较晚。2024年年初,DeepSeek发布第一版大模型即为百亿级参数大模型,5个月后,发布DeepSeek-V2,逐渐崭露头角:DeepSeek-V2提出了DeepSeekMoE的新型MoE架构,实现了更高的计算效率和更低的计算成本,提出的MLA架构创新将显存占用降至传统MHA架构的5%-13%。2024年年底,DeepSeek发布了千亿级的DeepSeek-V3,其中引入了FP8混合精度训练框架和MTP机制,显著减少计算资源的消耗的同时提升计算效率。2025年开年发布的DeepSeek-R1-zero及DeepSeek-R1使用了监督微调和强化学习的迭代训练方式和GRPO群体相对策略优化算法,降低了内存使用和计算开销,同时获得了强大的推理能力。
从测评结果上看,DeepSeek-R1大模型在多家国内外权威测评机构的综合榜单中名列前茅,仅次于OpenAI、谷歌等拥有极强计算能力的AI巨头。在ChatbotArenaLeaderboard上和中文大模型测评机构SuperClue的综合榜单上位列第四,在OpenCompass的学术榜单中位列第一。只看单一能力,在ChatbotArenaLeaderboard的测评结果中,DeepSeek的数学、指令遵循、多轮对话能力进入前五;在SuperClue的测评结果中,DeepSeek针对中小学数学竞赛的能力登顶,在链式推理能力也较为突出,但与ChatGPT仍有距离。
目前,DeepSeek主要用于C端体验,在B端生态上的合作还在起步中,但实力和名气再加上开源的DeepSeek并不缺少合作伙伴。目前,国内外华为云、百度智能云、阿里云、腾讯云、360数字安全、亚马逊AWS、微软Azure、英伟达等多个平台接入DeepSeek大模型供用户实时调用;吉利、极氪、岚图、智己等多个品牌的智能座舱已与DeepSeek大模型完成深度融合;北京银行联合华为率先引入部署DeepSeek系列大模型,探索DeepSeek大模型在金融领域的应用;极光GPTBots.ai作为领先的企业级AI智能体构建平台,正式推出基于DeepSeek集成的增强型私有化部署解决方案等。各行各业都在积极探索DeepSeek的深入融入带来的应用创新。同时,基于开源的大模型,高校、研究院等也在开发各个版本的DeepSeek模型,以提高其多模态交互等能力,如北大联合港科大团队基于自研全模态框架推出多模态版DeepSeek-R1:Align-DS-V等。
二、DeepSeek用户数增长迅猛,“男性”、“年轻化”、“中高消费人群”成为其用户标签
国内用户对DeepSeek的热情高涨。从极光月狐研究院的数据来看,截止至2025年2月7日,DeepSeek的安装量已超2亿;从发布到现在已半月有余,渗透率和DAU涨势惊人。从渗透率来看,DeepSeek从0.1%的渗透率到超越kimi成为行业第二仅用了10天时间,截止至2025年2月7日渗透率已超过16%,或有超越豆包成为行业首位之势;从DAU来看,DeepSeek为增长陷入瓶颈的行业带来活力,开工日(2月5日)达到了发布以来的峰值,实现了2467万的日活。
2025年1月,从新增用户特征数据上看,相较于头部生成式AI应用较为均衡的男女比例,DeepSeek目前68%的用户为男性;从用户年龄结构来看,DeepSeek较为年轻化,46岁及以上的中老年用户还未大规模进场。从用户分布及消费水平上看,一线城市和新一线城市成为DeepSeek的主战场,超过40%的用户集中于此,>85%的用户处于中高消费水平。
同时间,从运营数据上看,DeepSeek与豆包、Kimi的用户重合度较高,超过77%,豆包与Kimi也成为DeepSeek的主要来源与去向。DeepSeek的C端用户消费能力较高,利于其后期实现会员付费等模式;但与友商的用户重合度高,暂未形成独有的大规模用户群体。DeepSeek在磨练性能,努力成为重合用户第一选择的同时,也应在其定位上与豆包、Kimi有所区隔。这需要利用其技术创新的优势深挖应用场景。
三、DeepSeek结合“占卜”、“数学”等应用场景大出圈
目前C端用户挖掘出的DeepSeek的应用场景主要集中于占卜、数学推理、写作与陪伴等。在占卜场景中,DeepSeek生成内容准确度、完整度均超越友商应用。在数学问题中,与友商应用相比DeepSeek针对代数、逻辑等题型较有优势,准确度较高、但思考过程冗余多导致时间过长,同时泛化能力有待提高,针对带图的几何题答题效果较差;对比垂类应用如作业帮等,通用大模型应用在解题思路精准度、答案准确度上明显较差。在写作场景中,DeepSeek相对友商应用情感充沛,颇有哲思。
AI占卜
DeepSeek在小红书、抖音等平台大热,其中最突出的落地应用场景当属占卜算命。区别于“准了”、“预见塔塔”等塔罗、星盘付费占卜模式,DeepSeek主打“适合中国人体质”的“八字测算”。相比于豆包、Kimi等头部生成式AI应用,DeepSeek在八字排盘、格局分析、大运与流年方面都具有更详细的输出,在其思维链中也会显示如需更详细的信息需要提供哪些线索,在用户补充线索后能针对前序内容进行补充。但占卜应用难以验证其科学性及准确性,目前多以娱乐性为主。
AI数学
正如上文中部分机构对于DeepSeek能力的拆分测评中显示,DeepSeek在数学解答能力上较为突出。与豆包、Kimi等通用生成式AI应用的结果相比,其准确性更高,且展示出了明显的思维链路;但与作业帮等垂类应用相比,思考时间过长,过程存在冗余。
AI写作与陪伴
DeepSeek的中文写作能力相对其他生成式AI应用较强,经常针对问题给予哲学性较强或具有诗意的回答,提供情绪价值。同时,可根据用户的要求进行不同风格的文本输出,如模仿知乎、贴吧等平台,模仿鲁迅、张爱玲等作家的文笔等。但使用评价褒贬不一,且存在用户审美疲劳的情况。
其他
DeepSeek在办公过程中需要的框架性的内容生成等具有创新性,相较于目前较为同质化的内容,DeepSeek从行文风格上具有特殊性,同时因其思维链的存在能够展示各部分内容生成时使用的方法论。但在内容的充实性和规范化上仍与豆包等应用相差较远。
DeepSeek以其实力一跃成为全国甚至全球最受瞩目的大模型,正在诉说着“创新才能重塑A行业竞争版图、跻身前列”的逆袭故事。大模型仍处于高速迭代期,持续地“打碎重铸”才是守住行业地位,推动社会科技变革的关键所在。只有不断打破旧有的框架,才能在新的技术浪潮中占据主动,引领行业的发展方向。DeepSeek的成功案例与卓越的创新竞赛将带领中国企业从技术追随走向自主创新之路。