出品 |
作者 | 梁昌均
编辑 | 杨锦
“这是我觉得我们过得最有意义的一个春节,虽然大家在加班,但很有自豪感。”在近日《AI十二谈》的直播中,开源中国董事长马越直言。
节前,发布两款重磅国产模型的DeeSeek,在全球刮起AI旋风。作为中国最大的开源社区,开源中国联合多家国产算力厂商,加班加点上线DeeSeek推理服务。
DeeSeek为什么能火爆全球,业内已经讨论颇多。但必须要说,当大众都在讨论中美AI竞争的宏大叙事逻辑时,可能很多人都忽略了这家公司坚持开源的重要性。
“DeepSeek的胜利并非是中国AI战胜了美国AI,而是开源模型战胜了专有模型。”知名AI科学家杨立昆,或许是此前为数不多看到DeepSeek开源意义并发声的人。
但在中国,它同样鼓舞了包括马越等在内的投身于开源事业的开发者们。正是得益于DeepSeek不限制商用的开源协议,华为、腾讯、微软、亚马逊等国内外科技巨头,以及国内众多企业纷纷免费接入DeepSeek。
当被问到“如果DeepSeek闭源是否还会这么出圈”的问题时,马越的回答很直接:一定不会。
DeepSeek的开源意味着什么?闭源模型和开源模型,谁才是未来?它对中国开源生态发展又会带来什么机遇?以下是马越在直播中分享的十条深刻见解。
1、DeepSeek公开了代码、框架,包括权重、调参、优化措施等,是开源最彻底的模型。唯一没开源的是数据集。
2、开源是富人和强者的游戏,它不是目的,是手段,能把新技术的获取门槛降到最低。DeepSeek开源在于技术自信,是我们这一代年轻人的第一个里程碑,国运级的年轻人出现了。
3、DeepSeek意味着基于Transformer这条技术架构,加上蒸馏,矿挖的差不多了。未来能超过的一定是比Transformer更优化的新架构,一定会有很多的DeepSeek出现。
4、DeepSeek会倒逼更多纯粹的开源模型出现。闭源本质上是信息不对称的竞争,这样的竞争模式预计会被摒弃掉。
5、现在是波澜壮阔的AI大航海时代揭开序幕,大模型应用可能还没有那么ready。但不要焦虑,最重要的是不要浮躁,要去学基础知识和理论,准备好清水、食物和船员。
6、DeepSeek的出现是必然的,技术创新基本上得靠年轻人,年轻的创业团队要敬畏金钱,敬畏市场、竞争和投资回报,同时社会要多鼓励、多支持年轻人。
7、DeepSeek并没有彻底打败英伟达,没有绕过CUDA。打造中国自主可控、形成闭环的开源AI生态,这件事很难,我们也要去做。
8、把大模型类比为操作系统存在逻辑漏洞,DeepSeek可能是个超级APP,但它兼容不了所有相关的AI硬件,不是操作系统级的东西,无法成为AI时代的安卓。
9、DeepSeek的成功可以被模仿,但一定被极少数人模仿。不要因为它是开源团队,认为我们都可以成为它,要放弃这种妄念。
10、商业化绝不是DeepSeek现在的首要矛盾,首要矛盾是在Transformer这条赛道已经做到极致的情况下,有没有可能另辟蹊径,应该继续创新、创新、创新。
以下是此次直播对谈精编:
:DeepSeek爆火,很多人认为跟它选择开源有很大关系,如果它选择闭源,是否还会这么出圈?
马越:首先结论是一定不会。我相信以DeepSeek为代表的年轻团队,初生牛犊不拍虎,在巨人的肩膀上说,我们中国怎么可能一直都是拿来主义。
DeepSeek的技术自信就在于,他们相信不一定非有美国的背景,在透明的游戏规则下,在Transformer基本成为全世界公认的技术架构基础上创新,一定能另辟蹊径,走一条更低成本的道路。
:很多人都说它是大模型之光,是国运级的创新。但客观去看,我们在技术生态,包括开源生态这块,还是有比较大的差距。
马越:很多人说DeepSeek是不是连英伟达的CUDA(计算和编程平台)都绕过去了,把英伟达彻底打败了,不是这样的。
DeepSeek、OpenAI,开源也好,闭源也好,所有领先模型都是基于谷歌发明的Transformer,在这个基础架构上再创新,如此而已。但它依然很牛,它代表着我们在一个既定技术框架的再创新能力,世界顶级。
与其说它是一个国运级的创新,不如说是我们这一代年轻人的第一个里程碑,国运级的年轻人出现了。
:开源协议有很多版本,DeepSeek的开源程度和范围是什么样的?
马越:这次DeepSeek很开源,把代码、框架在论文里说的非常清晰,包括权重、参数怎么调的,踩了哪些坑,用什么优化措施,唯一没开源的是数据集。DeepSeek是目前开源最彻底的模型,但它依然不是百分之百彻底。
:DeepSeek这么大力度的开源,对于其它开源公司,包括对整个开源生态会带来什么样的影响?
马越:我相信这会倒逼更多纯粹的开源模型出现。开源是强者游戏,体现了技术自信。
:此前被大众熟知开源的模型并不多,形成生态的就更少了,多数开源模型其实没有受到关注,怎么看这种差异?
马越:第一,如果不开源,有人买吗?如果特别好卖,何必要开源。第二,开源了有人理你吗?有人替你传播,有人免费用吗?最终还是回归技术价值,产品价值。
:除了技术领先性,还有成本和易用性的考虑。如果成本特别高,或者易用性特别差,哪怕技术再领先,去开源,也并不一定会得到关注。
马越:开源是手段,开源不是目的。这个波澜壮阔的AI大航海时代揭开序幕了。很多大佬说基于模型的种种APP、应用会大行其道,但我觉得可能没有那么ready,今天就像互联网时代,刚知道能用猫上网了。
第二,现在最重要的是不要浮躁,去学基础知识,搞清楚大模型到底怎么工作。让人如此兴奋是这一次的机遇,我们知道会有一个美洲大陆,但它在哪儿不知道。最重要的是得有一艘自己的船,准备好自己的清水、食物和船员。
:DeepSeek允许模型蒸馏,李飞飞等团队就有在做。站在前人的肩膀上,会不会出现更多的DeepSeek,甚至是比DeepSeek更强的模型?
马越:蒸馏不是DeepSeek第一个发现,蒸馏某种意义上用模型教模型,过去是人教模型,现在是机器对机器,AI对AI,当然效率高了。
DeepSeek告诉我们,某种意义上,基于Transformer这条技术架构,加上蒸馏,矿挖的差不多了。未来真正超过这些的一定是基于比Transformer更优化的新架构,有可能比现在DeepSeek成本更低十倍,还快十倍。
:拉长周期看,您如何看待开源模型和闭源模型的竞争?
马越:开源天生就是利他主义精神的体现,跟全人类共享,这就是贵族精神。第二,坚持下去,最终会获得市场占有率,如安卓、Linux。中国现在还有鸿蒙和欧拉,都在重复这个过程。
在人类文明和人类知识平权的时代,要感谢互联网带来的信息对称,它已经成为人类创新的基础设施。闭源本质上就是信息不对称的竞争,这样的竞争模式估计会被摒弃。
:计算机时代或者互联网时代,开源被视为软件发展和应用的重要力量。在AI时代,开源对技术发展会起到更大的作用吗?
马越:开源实际上最终是把一个新技术的获取门槛降到最低。它是社会化的松散组织,但它是群体智能,弱关系一样推动创新,开源社区体现着人类文明最高效的社会。
我还是要强调创新基本上得靠年轻人。有资本问我,你觉得现在新的创业团队能不能再挖掘到一个DeepSeek,跟我说说创业团队的画像是什么?
我说就两点,第一创业团队要敬畏金钱,证明你对市场敬畏,对竞争敬畏和对投资回报的敬畏。第二就是对年轻人的敬畏,要给年轻人当梯子,多鼓励多支持。
:DeeSeek应该说为中国相对落后的开源生态提供了一个机遇,如何借助这波机会,进一步完善我们的国产AI开源生态?
马越:过去十几年,开源中国通过开源的力量,让平台上的1800万的软件工程师的软件工程能力与时俱进,跟美国比是犹有过之。未来十年,新的历史使命是通过开源的力量,让中国的软件工程师升级为AI工程师。
我们希望形成不依赖于英伟达、自主可控的中国开源人工智能生态,在国产GPU上跑中国的模型,形成闭环。但要知道英伟达的强,是CUDA生态,我们没有。没有CUDA架构,就算有能匹配所有这些开源模型的算力,适配就是海量工作,但这事儿再难我们也得做。
:不少观点认为,大模型会成为AI时代的操作系统。DeepSeek出现后,有人认为它会成为AI时代的安卓,您怎么看?
马越:我觉得这种类比有些逻辑漏洞。操作系统是应用和硬件之间的一个桥梁,移动互联网时代,说微信这样的超级APP是不是就是新的操作系统?到今天看不是,该有安卓还是安卓。
DeepSeek不能完成跟硬件的一切适配,它就不是个操作系统级的东西。它有可能是个超级APP,但它兼容不了相关AI硬件,那就不是操作系统。
:国内外互联网巨头和云厂商等很多企业,都宣布接入,以前好像没有说哪个模型受到这么高的追捧。您怎么看它对AI应用的影响?
马越:这些厂家第一时间连入了DeepSeek,第一是好事儿,第二肯定是浮躁,现在还早着呢,特别是B端应用。做应用的企业,核心竞争力一定不是模型能力,真正的壁垒回归到数据,domain knowledge,行业knowhow,对领域的真知灼见。
:DeepSeek主要是通过API收费,但它又开源,实际上会失去部分商业机会,很多人也在讨论DeepSeek是否应该接住这波泼天流量去做商业化。假设是您在负责这家公司,在技术方向、商业化、开源等方面,您会怎么做?
马越:首先如果是我负责DeepSeek,我第一想到的就是我得赶快辞职,这不是我的赛道,不是我的人生机遇和历史使命,我没有能力来管理。
第二,如果赶鸭子上架,我想千万别膨胀,别昙花一现,商业化的事儿绝不是现在的首要矛盾,现在首要矛盾是在Transformer这条赛道已经做到极致的情况下,有没有可能另辟蹊径。
我们心心念念整个国产开源模型和开源算力的闭环,比如中国的CUDA标准如何提出,对中国整个硬件GPU厂商的倒逼和推动,要争取把钱花在刀刃上,不要太多的沉没成本。
DeepSeek到今天,没有任何商业化压力,没有投资人的压力,现在还是继续创新、创新、创新就好了。
:最近很多人在问跟当时ChatGPT出来后相似的问题,为什么大厂没有做出DeepSeek,为什么中国只有一个DeepSeek?您怎么看这个问题?
马越:DeepSeek的成功可以被模仿,但一定被极少数人模仿——绝对年轻的精英团队,有足够的现金储备,也有很深厚的社会资源。不要因为它是开源团队,认为我们都可以成为它,放弃这种妄念。