在ChatGPT上线两百天之后,中国的大模型技术发展开启了“狂飙”模式。据称,中国已经有79个10亿参数规模以上的大模型发布。在这个激烈的竞争中,各大厂商都在努力赶超对手,否则就会被淘汰。
在人工智能领域,大模型技术的快速发展正在推动着行业应用的深度变革。随着大量新大模型的涌现,各大厂商都在努力赶超对手,以争夺市场份额。在这个激烈的竞争中,如何将大模型技术应用到行业中,实现落地成为了一个重要的话题。
大厂们都在积极推进大模型技术的研究和发展。百度文心大模型已经进化到了3.5版本,阿里通义千问则构建了家族模式,京东言犀大模型则是为自己“量身定做”的产业大模型,美团牵手清华系,领投AI公司智谱华章,360智脑将接入“360全家桶”。
大厂大模型技术的竞争非常激烈,今年上半年就有近百家企业宣布要做大模型。这些大厂和AI公司都在拼研发,想要在这个领域取得优势。不过,目前还没有明确的指标或者准则去验证谁家的大模型更优质,这使得评估大模型的技术能力变得困难。
最近,IDC发布了一份报告,提出了AI大模型技术能力评估框架。这个框架包括三个维度:产品技术、服务生态、行业应用。其中,算法模型和行业覆盖是衡量大模型能力最重要的两个指标。只有通过算法模型的突破,才能支撑更广泛的行业覆盖,使各行各业充分享受技术突破带来的红利,破解AI落地门槛高的困境。
大模型的研究也面临诸多挑战。首先,大模型的计算资源需求巨大,需要高性能计算集群和大量的GPU资源。这不仅增加了研究的成本,还使得大模型的部署和应用受到限制。其次,大模型的训练和调试难度较高,需要大量的的人力和技术积累。此外,大模型的部署和应用也需要考虑到实际场景中的各种问题,如数据质量、模型部署的可靠性和安全性等。
在这个激烈的竞争中,各大厂都在努力提升自己的大模型技术能力。百度的技术布局比较完整,具有“芯片-框架-模型-应用”四层技术栈,阿里云则是在服务能力和生态合作上表现出色,腾讯云和京东云则分别在行业大模型和供应链方面进行深耕。科大讯飞等AI厂家则在垂直赛道上表现出色。
据头部财经观察,大模型已经开始与场景、行业进行深度融合,并在多个领域取得了成功的应用。例如,华为盘古大模型已经在气象、医药研发、电力、语种等领域落地,并交付了多个千亿参数大模型。腾讯云行业大模型能力将应用到金融风控、交互翻译、数智人客服等场景中,提升了智能应用效率,一站式MaaS服务为企业减负。在金融领域,行业大模型可以加持金融风控解决方案,相比之前有了10倍效率提升,整体反欺诈效果相较于传统模式,提升了20%左右。
大模型的发展不仅停留在科技企业,已经走向各行各业。随着大模型技术的不断进步和应用场景的不断拓展,如何落地及商业化正在成为厂商追求的重点。在这个过程中,各企业和机构逐渐找到了自己的定位,逐渐走向细分方向,最终被更完善的大模型收入麾下。这需要多年的积累和非常综合的能力,在心态上也必须抱有绝对的长期主义,没有绝对经济实力的玩家,会被甩在半路或者“死”在通往光明的路上。
大模型在应用层面未来想象空间非常大,可以通过新AI技术提效,应用层面的价值一定会分流,依托几个头部大模型会有非常广泛的应用生态。未来所有的企业都会强依赖大模型,所有的产品都会基于大模型来开发。而行业渗透率和市场份额,将成为企业大模型走向寡头最重要的挑战元素。