近年来全球人工智能技术加速迭代,中国的大模型企业展现出强大的创新活力。尤其DeepSeek-R1模型的横空出世,不仅以一系列颠覆式创新重新定义了行业标准,更为全球范围内的AI普惠与产业升级提供了全新路径,也因此成为近期AI创业领域无可比拟的焦点所在。
2月25日,360集团创始人周鸿祎受清华大学邀请,在清华校园面向线上线下约3000名清华大学的本科生、硕士、博士及创业者等进行了一场主题为“DeepSeek给我们带来的创业机会”的授课。他以DeepSeek带来的变革为切入点,深入剖析AI行业发展趋势,并分享了AI技术于创业的应用前景。
周鸿祎首先重申了自己在DeepSeek-R1模型出现前对AI行业作出的十大预判:传统AGI发展趋缓,亟待探索新路;慢思考成为新的发展模式;模型越做越专、越做越小、成本越来越低;知识的质量和密度决定大模型能力;多模态越来越重要;智能体推动大模型快速落地;开源效果追赶上闭源,以及中美差距快速缩小等,并指出DeepSeek-R1的出现验证了他的预判,且“DeepSeek的创新更具颠覆性”。
“DeepSeek-R1和以GPT-4o为代表的预训练模型不是同一个物种,R1突破了大模型Scaling Law(缩放定律)的瓶颈,为人类通往AGI找到方向”,周鸿祎说。
周鸿祎介绍,与“堆显卡”“堆算力”路线的传统预训练模型不同,以DeepSeek-R1为代表的推理型模型更加注重逻辑推理和深度分析能力,可利用合成数据解决数据用尽问题,通过逻辑链条推导答案,分解规划,自我反思,学会“慢思考”,在不增加预训练成本的同时大幅提升模型性能和复杂问题的解决能力,因而从预训练Scaling Law转变为强化学习Scaling Law,开辟强化学习新范式。
周鸿祎进一步指出,尽管OpenAI的o1模型同样采用强化学习方式且更早推出,但与DeepSeek-R1相比,其一方面为收费使用,用户规模相对较小,另一方面为闭源架构,技术未公开。因此,免费使用、技术公开且用户规模庞大的DeepSeek-R1成为了“AI发展史上的重要里程碑”。
在周鸿祎看来,DeepSeek-R1实现颠覆式创新的原因并不局限于技术方面的突破,更好的用户体验,以及开源、免费、低成本等特性同样缺一不可。其在用户体验方面的重要突破在于更加理解用户需求,大幅降低prompt(提示词)要求,直接呈现思维过程,展现出像真人一样思考的能力,提高用户的信任度。同时它结合了实时搜索与复杂推理能力,通过网上实时数据矫正模型幻觉。
“DeepSeek-R1春节期间零广告投入,7天收获1亿用户,创最快应用破亿纪录,关键在于优化用户体验,让人工智能从‘不可用、凑合用’迈向‘都能用、都爱用’,在中国实现AI全民普及,中国有望借此成为全球AI普及率、渗透率最高的国家,加速AI产业革命爆发步伐。”周鸿祎谈道。
周鸿祎表示,DeepSeek的开源模式优势尽显,促使全球公司、开发者等纷纷转向开源阵营,从而建立起强大生态,使DeepSeek的开源技术成为全球AI的“根技术”。在无主动推广的情况下,各国政府、企业、云厂商纷纷接入,影响力辐射全球,引领的开源文化加速中国在全球AI领域跻身领先地位。
周鸿祎提到,DeepSeek-R1模型出现后,中国普通用户使用AI工具的先进性和普及率远超美国。一方面企业与政府因其开源透明、可信,从而进行大量私有化部署;另一方面DeepSeek将研究成果开源共享,终结中国百模混战,节约大量开发经费。同时众多公司、开发者参与模型优化,并基于其生态开发应用,促进AI应用如寒武纪大爆发般蓬勃发展。此外,其适配国产硬件、降低推理与训练成本、公开蒸馏方法等创新,使人工智能技术门槛骤降,创业者有机会与巨头同线起跑,发展中国家也有机会入局,迈向人类命运共同体。
“DeepSeek又好又免费,每个人都能拥有,从而引爆应用奇点”,周鸿祎说。他认为,未来应用将从六大方向实现爆发:第一,人人智能——DeepSeek的开源与低成本特性赋能个人拥有自有大模型,成长为超级个体;第二,万物智能——AI赋能智能硬件全面革新;第三,数转智改——帮助传统产业、制造业打造新质生产力,利用AI降本增效;第四,未来产业——低成本低算力需求使模型更容易被部署到机器人等智能设备;第五,科学研究——基于DeepSeek的强推理模型,利用科学领域专业知识进行强化学习,打造更加专业的科学推理模型;第六,AI安全——360提出“以模制模”新解法,用安全大模型应对DeepSeek广泛应用后引发的安全问题。
周鸿祎特别强调了DeepSeek如何在政府和企业应用的问题,他表示,DeepSeek虽然能力强大,个人使用绰绰有余,但要在政府、企业应用需要和场景结合,“不要幻想用一个大模型解决企业所有问题,而是找垂直场景,做专业技能大模型”。他认为企业内部未来一定是多个大模型组合工作,DeepSeek开源、免费、能力强大、可本地部署等特性是打造专业大模型、垂直大模型、场景大模型的最佳选择。
周鸿祎同时表示,有了场景之后,只有DeepSeek还不够,解决企业应用,打造专业大模型,还应解决知识库和智能体打造等问题。其中知识库打造是DeepSeek更懂企业的基础,打造智能体则能通过大模型调用各种工具,将日常重复性业务流程形成Playbook,实现流程自动化。
而对于个人应如何更好地拥抱DeepSeek,提升AI能力,周鸿祎推荐使用“纳米AI”个人版作为学习AI、了解AI、掌握AI的工具。纳米AI搭载DeepSeek-R1联网满血版模型,可实现“实时搜索+复杂推理”的完全融合,且服务稳定;支持语音搜、拍照问,可直接生成答案,并支持文生图、图生视频等多模态功能,用户体验超过DeepSeek官方版本。此外,纳米AI集成国内16家大模型厂商50多款模型,用户可按需选择,并可多模型协同。用户还可借助纳米AI打造个人的专业知识库和智能体,拥有属于自己的AI工具和数字助手。
免责声明:本文仅供参考,不构成投资建议。
广告