2024年11月12日,优刻得凭借自研的云端算力引擎“孔明”智算平台,成功入选中国人工智能产业发展联盟(AIIA)发布的《2024年人工智能先锋案例集》,成为AI Infra领域的先锋企业,不断驱动多模态大模型的创新应用与发展。
为响应国家“人工智能+”行动号召,中国人工智能产业发展联盟、工业和信息化部新闻宣传中心、中国信息通信研究院2024年共同启动了“2024年人工智能先锋应用案例”征集活动,征集工作得到了行业和社会的广泛响应。旨在甄选并推广具有高价值、标杆性、真落地的行业典型案例,更好地推动我国人工智能技术应用及产业发展。
在多模态大模型应用领域,行业普遍面临算力资源成本高昂、资源调度管理复杂以及模型训练和推理的低效瓶颈,导致众多模型厂商在推进大模型技术的过程中,被限制了数据处理、实时推理和模型迭代上的能力和速度。
在这样的背景下,优刻得“孔明”智算平台应运而生。以其多元异构的算力资源、高效便捷的管理服务、安全可靠的运行环境,为大模型训练和推理过程提供稳定高效的算力支持和集群调度能力,以帮助AI企业更好地管理异构资源,并根据负载动态分配不同任务。
以先进的技术架构为模型厂商提供强大的算力支持和调度管理能力,“孔明”智算平台具备三大核心特性:
●多元算力统一调度
“孔明”智算平台可对万卡集群统一纳管。支持对同构和异构GPU、高速计算网络、本地NVMe及并行文件存储的统⼀调度管理。智算集群的弹性扩展能力,可根据客户当前的资源数量进行集群动态管理。
●高效分布式训练
“孔明”智算平台提供了稳定可靠的模型研发环境。平台预置主流算法框架,支持多任务同时训练,并可根据优先级抢占资源。此外,其断点续训的能力,可实现大模型训练任务异常时自动拉起,大幅缩短算力闲置时间,使得模型开发者能够更充分地利用GPU算力资源,以更低成本、更高效率来训练和优化模型,加速AI大模型在各领域的落地应用。
●可视化智能运维
“孔明”智算平台对集群管理人员提供了可视化的资源管理界面,可对算力分配、算力监控、算力使用情况进行运营分析,极大程度简化了算法工程师的重复操作。通过多项目团队同时协作,减少管理成本、提升模型研发和部署应用效率。目前,平台已广泛应用于大模型训练、城市治理、自动驾驶、生物医药、工业制造等领域。
近年来,优刻得持续发力大模型领域,提供了一整套涵盖算力基础设施建设、训练流程优化、智算调度平台、高性能网络与存储等在内的智算解决方案,不断夯实大模型智算底座助力大模型厂商快速实现模型的研发与迭代工作。
优刻得“孔明”智算平台的成功入选,不仅是对优刻得AI技术底座的实力认可,更是对其在推动人工智能产业发展方面所做努力的肯定。未来,优刻得将以更加智能、高效的智算解决方案赋能更多AIGC创新应用落地。欢迎登录UCloud优刻得官网体验“孔明”智算平台。