文 | 智能相对论
作者 | 陈泊丞
时至今日,随着越来越多的企业和机构不断加速把AI技术融入自己的业务流程中,AI正持续改变着千行百业的业务模式。
在客户服务领域,聊天机器人已经可以7*24小时提供服务支持,减少了对人工客服的依赖。在供应链管理领域,AI正在通过分析历史销售数据预测未来需求,帮助企业更好地规划库存。在制造领域,AI质检系统能够自动识别产品缺陷、分类问题并提供实时反馈,从而帮助企业提升生产质量、减少人工成本以及加快产品上市时间等等。
这些AI应用在不同的行业场景大量涌现,而率先接入AI技术的厂商或企业也开始尝到了技术创新所带来的发展红利。市场对AI的热情日益增长,与此同时,技术的迭代似乎也不可避免地抬高后来者的进入门槛,新的应用挑战和落地难题在不断被放大。
对于没有深厚AI技术积累的企业而言,应该如何赶上这波红利?市场同样在寻求解答思路,而大模型一体机的走红恰好在这个节点上为行业指明了路径。
在2024中国算力大会期间,浪潮信息重磅发布元脑企智EPAI一体机,通过软硬件高度协同的一体化设计,为客户提供多元多模、简单易用、本地部署、安全可靠的大模型开发平台。——这样的解题思路无疑将成为行业的共识,但是具体来看,大模型一体机应该如何帮助广大企业群体找到更省心、更快速的AI引用落地路径,从而加速大模型产业化落地?这样的问题还得回归行业中去寻找具体的答案。
四大挑战,让企业望“AI”兴叹
随着大模型技术不断升级和成熟,尽管应用前景广阔,但在实际部署过程中,许多企业仍面临着诸多挑战。如果不克服这些挑战,就很难实现大模型应用系统性的落地。
其一,由于产业生态离散以及行业应用的具体需求,大模型落地面临着多元多模适配难的困境。一方面,从芯片到软件框架,再到模型本身,不同厂商提供的产品存在数据源不同、技术标准不一等情况,很难进行统一适配,易用性差,需要企业在应用的过程中处理好多元多模的问题,即做出选择、做好兼容,才能完成AI应用的落地。
另一方面,源于行业场景的复杂性,单一的算力资源和大模型产品很难完美地解决实际性问题。多元多模是企业面向场景问题落地大模型应用的一个必要配置,即兼顾多元算力和多样大模型的选择、适配与协同。
比如,在一个常见的智能交通场景,短期内的车流监控会采用边缘算力和面向交通场景的端侧大模型进行实时处理,而长期积累下来的交通监控数据则会传回云端,采用云端算力和云端的通用大模型进行分析、解读,以辅助交通部门对城市道路的交通情况进行调控。——这样的场景需要多元多模的思路来解决,也必然要解决好多元多模问题才能完美实现。
其二,计算模式的选择将影响大模型开发与落地的实际效率。目前来看,以云边端为主导的计算模式正在成为AI产业发展的一个主流趋势,综合性的计算解决方案可以结合边缘计算的低延迟和云服务的强大计算能力,通过合理的任务分配实现最佳性能。
但是问题的关键则在于,综合性的计算解决方案会促使系统设计和管理变得更加复杂,需要考虑如何有效地划分任务以及协调不同节点之间的通信,解决好异构算力的调度难题。简单来说,企业落地大模型应用无法再单一地依赖云计算,而需要考虑到边缘计算与实际场景需求的适配,否则就会直接影响大模型开发和应用的效率。
其三,数据治理难的问题再上一个层级。数据是AI系统的“燃料”,没有高质量的数据,就无法训练出高性能的模型。长期以来,数据治理就是一条复杂的链条,包括了数据的识别、清洗、标注、分类、存储、应用等多个环节。
过去,业内试图在云端打造一条完整的数据治理链条,但随着大模型应用走向深实,越来越多的企业开始意识到核心的数据资产过于敏感,放在云端难以保障隐私和安全性,开始寻求“数据不出域”的解决方案。而这样的解决方案不仅需要构建一条同样完整的端侧数据治理链条,做好本地数据与端侧大模型的匹配协同,还需要进一步与云端数据治理解决方案融合,无形之中又加剧了数据治理的难度。
其四,学习成本高的问题始终困扰企业开发和落地大模型应用。综上,不难发现,不管是多元多模的客观问题,还是基于多元多模所延伸出来的计算模式、数据治理等难题,对于企业而言都意味着高门槛。如果企业内部没有深厚技术积累的IT团队,解决好这些问题的难度还将上升,难以估量。
因此,摆在行业面前的是一个进阶的问题,不仅要解决好客观存在的技术性问题,还要进一步降低企业的应用门槛,让没有IT团队或没有深厚AI技术积累的企业能在不增加太多成本的情况下获得更省心更快速的大模型开发和应用解决方案,完成AI落地。
大模型一体机,能让企业少走多少弯路?
大模型一体机的出现以及在市场上走红,似乎给行业提出了一条切实可行的路径。具体来看,以浪潮信息发布的元脑企智EPAI一体机为例,其基于三点进阶能力让企业在落地大模型应用的过程中少走了不少弯路。
一、基础底座的打造,避免大模型应用根基不稳。
很多企业在落地大模型应用的过程中,一上手就先基于通用大模型做业务开发。当业务开发不少了,才发现算力不够用、模型消耗太大,对业务的适配性太弱等问题开始暴露。这个时候,就不得不回过头来重新构建“算力+模型”的基础底座,再把开发完成的业务重新进行适配或迁移,工程量就大了。而元脑企智EPAI一体机具备多元算力和多模管理能力,一台机器就可以率先帮助企业稳定基础底座的构建。
一方面,元脑企智EPAI一体机可以通过大模型计算框架TensorGlue实现异构算力调度,同时通过算子基础化技术,还实现了上层模型算法和下层基础设施的逻辑解耦,能高效地屏蔽模型和芯片差异,从而降低企业跨算力平台迁移、多元模型部署适配的试错成本。另一方面,元脑企智EPAI一体机目前还支持10+业界主流大模型计算框架,同时也内置了7个主流基础大模型,预设了20+微调参数,企业根据不同的场景和业务需求可以快速开发模型应用。
二、全流程工具提供,解决企业上手难的问题。
大模型应用落地难度大对于企业而言,不仅是“算力+模型”的选择与适配,还有后续一系列流程如数据、微调、RAG、部署、上线、运维等环节的理解与攻关。而在这个方面,浪潮信息的研发团队自2007年起就开始在异构加速计算以及背后一系列的工作。时至今日,这种长期的探索和积累正在通过元脑企智EPAI一体机转化为一站式大模型开发解决方案开放给行业客户。
根据浪潮信息产品方案开发部总经理魏健介绍,元脑企智EPAI一体机提供从数据准备、大模型微调、知识库构建、大模型部署上线运维的全流程支持工具链,将快速且低成本地帮助企业构建开发专属大模型的能力。比如,针对大模型微调,元脑企智EPAI一体机采用低代码可视化界面来进行微调,并且内置了Lora、SFT等多种微调框架以及20多种优化参数。用户可依据具体业务需求和数据特性,选择最为合适的框架与技术。
三、本地化部署思维,免去后顾之忧。
在大模型产业发展的过程中,云端部署的风险和弊端逐步显露,企业的关注点也开始从云端转向云、边、端一体,愈发注重本地化部署模式的结合。特别是数据不出域的需求,决定了企业在进行大模型应用落地的过程中比以往更重视本地化部署。
在这个节点上,元脑企智EPAI一体机的本地化部署模式提供全链路的企业数据防护能力,设置多级过滤和审核体系,不管是部署模式还是安全能力,都非常好地帮助用户解决好数据治理问题,不用担心大模型应用落地一段时间后还要再考虑数据是否安全、会不会被泄漏等后续问题,免除了企业发展AI的后顾之忧。
总的来说,“算力+模型”基础底座全面且稳定,当前凭借全流程工具链易上手,未来基于本地化部署模式无后顾之忧,元脑企智EPAI一体机所提供的解决方案既兼顾当前的应用落地问题,也考虑到了未来长期主义的发展。——企业在落地大模型应用时,就不需要再重复绕弯子,直接底座构建-工具链开发应用-本地化部署一条路走到底。
站在前人的经验中,把未来的发展时间抢回来
大模型一体机意味着什么?从浪潮信息的元脑企智EPAI一体机或是业内其他厂商的产品,可以看到大模型一体机正在综合过去企业落地AI应用的各种路径和经验,以集成化、智能化的思路最终形成了当前的解决方案,仅凭一台机器就解决了大模型应用开发的诸多问题。
不可置否,AI行业日新月异,在这个不断迭代、交替的过程中,前人已经走了不少弯路。比如,过去很多企业落地大模型应用,大多是在云平台上基于通用大模型进行开发,随着业务深入,进而寻求行业大模型、企业大模型的专精开发,再意识到云计算所提供的算力不够用,开始转向边缘计算,探索云边端一体的发展。
这是一种自上而下的视角。一路走来,我们也很容易意识到大模型应用落地的问题出在哪里。如今,基于前人的经验,大模型一体机则有机会针对性地解决这些问题,提供了一个自下而上的发展视角。
正如元脑企智EPAI一体机所带来的解决方案,一上来就先系统地解决好多元算力、多模应用的基础底座构建问题以及后续的本地数据治理问题,然后再一步步向上推进,依托全流程工具链做好应用开发,从而帮助企业规避前人走过的“坑”。
未来,如果企业的业务继续向智能化转型,只需要在顶层做好大模型应用开发即可,不需要再回过头来做底层的基础设施重构或迁移。在发展上,这就相当于把未来的时间抢了回来。
随着大模型技术越来越普遍,企业的发展亟需智能化应用提高效率,少回头一步,企业越能在日益激烈的市场竞争中抢占几分优势,率先吃到技术创新的红利。由此,大模型一体机或许才会在现阶段出现并迅速火爆,成为业内的共识吧。
*本文图片均来源于网络
此内容为原创,
仅代表个人观点,未经授权,任何人不得以任何方式使用,包括转载、摘编、复制或建立镜像。
部分图片来自网络,且未核实版权归属,不作为商业用途,如有侵犯,请作者与我们联系。
•AI产业新媒体;
•澎湃新闻科技榜单月度top5;
•文章长期“霸占”钛媒体热门文章排行榜TOP10;
•著有《人工智能 十万个为什么》
•智能家电(含白电、黑电、智能手机、无人机等AIoT设备)、智能驾驶、AI+医疗、机器人、物联网、AI+金融、AI+教育、AR/VR、云计算、开发者以及背后的芯片、算法等。