当前位置：首页 » 资讯 » 新科技 » 正文

低于1TB 支持100并发！联想AI服务器首次实现本地部署DeepSeek满血大模型性能突破

IP属地北京 编辑：冯璃月雷科技 时间：2025-03-03 12:05:22

近日，联想集团宣布基于联想问天WA7780 G3服务器，在行业内首次实现单机部署DeepSeek-R1/V3 671B大模型，以低于行业公认1TGB显存（实际768GB）承载100并发用户流畅体验，可以满足千人以上企业的使用需求，为行业树立了企业级大模型部署新基准。
突破性能限制，树立DeepSeek-R1大模型部署新基准
作为全球关注的焦点，众多企业正准备在本地化部署DeepSeek大模型。然而，在落地实施过程中用户普遍面临以下关键决策难题：单机能否部署满血版DeepSeek R1？所需最低配置是什么？如何确保高并发与吞吐量下的优质体验？如何避免采购陷阱？
联想此次突破为企业提供科学选型指南。针对行业公认1TB显存是千亿参数大模型运行基线的背景下，联想研发团队通过专家并行优化、智能访存架构升级及PCIe 5.0全互联架构创新，大幅提升了显存利用率，从而实现了性能的提升。
联想实测数据显示，在512 token标准测试环境下，该系统可支持100个并发用户持续获得每秒10 token的稳定输出，首token响应时间压缩至30秒内。即便面对4K长序列复杂场景，仍能保持25个并发用户同等性能表现。
尤为值得关注的是，这台服务器仅配置了8张96GB显存的GPU卡。而DeepSeek-R1大模型的模型参数就需占用约700GB显存，仅余不到100GB显存空间可需用于KV-Cache等计算，如果不做专门优化，仅能支持2、3个用户接入。
联想在万全异构智算平台的加持下通过精心优化实现了突破，成功达成了用户最为关注的三项关键指标：首token延迟小于30秒、单token延迟小于100毫秒、支持2K以上长序列问题处理，同时实现了20%以上的成本节约，充分彰显了联想在服务器领域的深厚技术积累与创新实力。
联想问天WA7780 G3大模型训推一体服务器
持续优化升级，解决用户体验难题
联想的这一创新成果揭示了设备选型的新维度，也提醒企业审慎评估各种测试数据，摒弃对总吞吐量和总并发数等指标的片面追求，而应从用户体验出发，关注这些指标背后的隐藏信息，如数据精度等。实际上，如果将数据精度从FP8转为int8或int4（即量化），虽能明显改善性能表现（如更高并发量和高吞吐量），但会牺牲结果的准确性，显然这不是用户所期望的。
需要特别指出的是，高吞吐量和高并发量也并不等同于用户体验好。若服务器GPU卡配置不高，局部通信瓶颈可能引发响应延迟使体验降级，这正是联想着力解决的难点之一。
毫无疑问，联想技术突破将有效破除大模型落地瓶颈，显著加速大模型在企业的落地进程。未来，联想基础设施业务群与联想研究院先进计算实验室将继续携手合作，依托联想万全异构智算平台对DeepSeek平台从AI预训练、后训练到推理的全流程进行持续优化，为客户奉献出性能更佳、性价比更高的产品和解决方案，以加速DeepSeek大模型的落地，推动新一轮生产力革命。

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

网易执行副总裁丁迎峰减持4.1万股套现3000万

卢伟冰：小米手机三年内冲击2亿台销量汽车出海2027年

被雀巢全资控股，中国糖果大王徐福记40%股权又被卖了，创始人徐氏家族淡出

小米汽车官方旗舰店入驻京东天猫

360宣布与华为深度合作：华为将提供昇腾云服务器，为纳米AI提供算力支持

元宝登顶苹果应用榜首，超越DeepSeek

花旗银行误将81万亿美元转给个人！专家：数据保护、备份机制可从技术上预防 | 金融

努比亚Flip 2明天发布：行业首款全尺寸内嵌DeepSeek小折叠

蜜雪冰城：4 万店之后的故事怎么讲？

重大资产重组！又一A股公司宣布，今天已停牌！

一年收入 19 亿，七旬夫妇干成“行业一哥”，冲击 IPO

3 年赚 1.4 亿，利润率领跑行业巨头，“江苏胖东来”冲刺 IPO

曝iPhone 17 Pro系列升级12G内存：标准版和Pro版差距又一次拉大

事关国有资产交易！国务院国资委最新修订

“南孚电池”出手，拯救 150 亿重庆独角兽

最薄最美Ultra！曝OPPO Find X8 Ultra厚度不到9mm

上海杀出超级隐形冠军：年入 40 亿，全球第二

文远知行创始人韩旭回应“自动驾驶是否将导致大量工作被取代”

雷军：武汉的小米智能家电工厂预计今年年底大规模投产

国家知识产权局核准“神舟二十号载人飞行任务标识”等

苹果用户无奈吐槽：已存在数年的Bug究竟何时修

三星Exynos 2500被曝良品率不足五成 Galaxy Z Flip系列前景堪忧

乔布斯临终嘱托曝光：不要去想“史蒂夫会怎么做”

营收、净利润双降涪陵榨菜2024年业绩继续承压

黄百鸣被指控涉嫌内幕交易传递娱乐单日股价跳水

龙芯中科2024年净亏损6.24亿元工控类芯片营收大降

苹果新测试版系统“翻车” 部分机型遇“变砖”BUG

全站最新

网易执行副总裁丁迎峰减持4.1万股套现3000万

卢伟冰：小米手机三年内冲击2亿台销量汽车出海2027年

被雀巢全资控股，中国糖果大王徐福记40%股权又被卖了，创始人徐氏家族淡出

小米汽车官方旗舰店入驻京东天猫

360宣布与华为深度合作：华为将提供昇腾云服务器，为纳米AI提供算力支持

元宝登顶苹果应用榜首，超越DeepSeek

花旗银行误将81万亿美元转给个人！专家：数据保护、备份机制可从技术上预防 | 金融

努比亚Flip 2明天发布：行业首款全尺寸内嵌DeepSeek小折叠

热门推荐

网易执行副总裁丁迎峰减持4.1万股套现3000万

卢伟冰：小米手机三年内冲击2亿台销量汽车出海2027年

被雀巢全资控股，中国糖果大王徐福记40%股权又被卖了，创始人徐氏家族淡出

小米汽车官方旗舰店入驻京东天猫

360宣布与华为深度合作：华为将提供昇腾云服务器，为纳米AI提供算力支持

元宝登顶苹果应用榜首，超越DeepSeek

花旗银行误将81万亿美元转给个人！专家：数据保护、备份机制可从技术上预防 | 金融

努比亚Flip 2明天发布：行业首款全尺寸内嵌DeepSeek小折叠

蜜雪冰城：4 万店之后的故事怎么讲？

重大资产重组！又一A股公司宣布，今天已停牌！

一年收入 19 亿，七旬夫妇干成“行业一哥”，冲击 IPO

3 年赚 1.4 亿，利润率领跑行业巨头，“江苏胖东来”冲刺 IPO

曝iPhone 17 Pro系列升级12G内存：标准版和Pro版差距又一次拉大

事关国有资产交易！国务院国资委最新修订

“南孚电池”出手，拯救 150 亿重庆独角兽