近日,金山云完成基于国产芯片的DeepSeek满血版适配。同时,金山云星流训推平台也已完成DeepSeek满血版的部署,且支持多机部署实现分布式推理。
通过提供稳定且强大的算力支持,金山云能助力模型充分发挥其性能优势,使得其在自然语言处理、智能问答、文本生成等多个领域表现优秀,这将为用户带来更强大、更高效的人工智能体验。
金山云在搭载国产GPU的裸金属机型上进行了适配,公司提供已预装好包含 DeepSeek满血版和所有依赖环境的自定义镜像,用户只需在金山云裸金属服务器控制台选择地域与机型、选定内置DeepSeek满血版的自定义镜像、配置网络与安全、设置基本信息并确认配置后,即可轻松完成部署。
金山云裸金属服务器控制台创建入口
2.金山云裸金属服务器控制台创建流程,选择内置DeepSeek满血版的自定义镜像创建
创建完成后,开发者和企业一键启动模型就能立即投入使用,大大降低了模型的使用门槛。这不仅能让更多开发者和企业快速享用DeepSeek满血版的强大功能,还将加速人工智能项目的落地与应用。
经过测试和验证,DeepSeek满血版在搭载国产GPU的裸金属机型上于多个领域都展现出了不凡的性能。在智能客服场景中,能够快速理解用户的复杂问题,并给出准确且人性化的回答。与其他同类模型相比,在语义理解的准确性和文本生成的流畅性方面都具有明显优势,为各行业的智能化升级提供了有力支持。
为加速企业AI规模化落地,金山云推出了模型在线服务功能,提供从模型部署到调用的服务能力。聚焦高效部署与分布式推理协同,该平台可通过智能任务调度与跨节点并行计算,实现模型的高效推理。无需复杂配置,用户即可在公有云环境构建稳定、高性价比的模型服务。
此前金山云星流训推平台已支持DeepSeek蒸馏版的部署,现支持多机部署DeepSeek满血版,可实现分布式推理。
多机部署步骤详情如下:
1. 进入算力平台控制台并创建资源池
2. 进入模型在线服务导航页
3. 点击新建,创建模型在线服务
a. 选择R1或V3模型,平台默认勾选多机部署,用户可自主配置服务副本数以及多机部署的节点数量
b. 填写基本信息、资源、网络等配置
c. 点击确认,模型开始部署
注:R1、V3模型部署所需时间较长,请耐心等待
4. 调用模型服务。模型部署成功后,即可对模型进行调用,金山云当前支持接口和WebUI两种调用方式,相应的调用操作流程如下:
a. 接口调用
b. WebUI调用,模型部署成功后点击模型名称进入模型概览页,点击访问WebUI即可通过WebUI形式实现模型调用
首次进入WebUI页面需注册用户账号,注册完成后登录即可使用界面实现调用。