当前位置：首页 » 资讯 » 新科技 » 正文

英伟达发布Llama-3.1-Nemotron-51B AI 模型

IP属地北京 编辑：陈丽 IT之家 时间：2024-09-25 14:06:24

9 月 25 日消息，英伟达 9 月 23 日发布博文，宣布推出 Llama-3.1-Nemotron-51B AI 模型，源自 meta 公司的 Llama-3.1-70B，不过创新使用神经架构搜索（NAS）方法，建立了一个高度准确和高效的模型。
Llama-3.1-Nemotron-51B 简介
Llama-3.1-Nemotron-51B AI 模型将于 meta 公司 2024 年 7 月发布的 Llama-3.1-70B 模型，共有 510 亿参数。
该 AI 模型主要采用了神经架构搜索（NAS）技术微调，平衡性能和效率，在高工作负荷下，只需要一片 H100 GPU 即可运行，大大降低了内存消耗、计算复杂性以及与运行此类大型模型相关的成本。
英伟达认为这种方式在保持了出色的精度前提下，显著降低了内存占用、内存带宽和 FLOPs，并证明可以在创建另一个更小、更快的变体来加以推广。
Llama-3.1-Nemotron-51B 性能
相比较 meta 的 Llama-3.1-70B 模型，Llama-3.1-Nemotron-51B 在保持了几乎相同的精度情况下，推理速度提高了 2.2 倍。
准确率能效
MT BenchMMLUText generation(128/1024)Summarization/ RAG (2048/128)Llama-3.1- Nemotron-51B- Instruct8.9980.2%6472653 Llama 3.1-70B- Instruct8.9381.66%2975339 Llama 3.1-70B- Instruct (single GPU)——1274301 Llama 3-70B8.9480.17%2975339效率和性能方面的突破
开发 LLM 过程中面临的主要挑战之一是如何平衡精度与计算效率。许多大规模模型都能提供最先进的结果，但却需要耗费大量的硬件和能源资源，这限制了它们的适用性。
英伟达的新模型在这两个相互竞争的因素之间取得了微妙的平衡。
Llama-3.1-Nemotron-51B 实现了令人印象深刻的精度与效率权衡，减少了内存带宽，降低了每秒浮点运算次数 (FLOP)，并减少了总体内存占用，同时不影响模型执行推理、总结和语言生成等复杂任务的能力。
改进工作量管理，提高成本效益
Llama-3.1-Nemotron-51B 的一个突出特点是能够在单个 GPU 上管理更大的工作负载。该型号允许开发人员在更具成本效益的环境中部署高性能 LLMs，在一个 H100 设备上运行以前需要多个 GPU 才能完成的任务。
Llama-3.1-Nemotron-51B 模型还减少了内存占用，在推理过程中可以在单个 GPU 上运行 4 倍以上的工作负载，从而带来了一系列新的机遇。
架构优化：成功的关键
Llama-3.1-Nemotron-51B 的成功主要归功于一种新颖的结构优化方法。传统上，LLMs 是使用相同的块构建的，这些块在整个模型中重复出现。
这虽然简化了构建过程，但也带来了效率低下的问题，特别是在内存和计算成本方面。
英伟达通过采用 NAS 技术来优化推理模型，从而解决了这些问题。该团队采用了分块蒸馏过程，即训练更小、更高效的学生模型（student model），以模仿更大的教师模型（teacher model）的功能。
通过完善这些学生模型并评估其性能，英伟达开发出了 Llama-3.1 版本，在大幅降低资源需求的同时，还能提供类似的准确度。
Puzzle 算法和知识蒸馏
Llama-3.1-Nemotron-51B 有别于其他模型的另一个关键组件，就是 Puzzle 算法。
该算法对模型中的每个潜在区块进行评分，并确定哪些配置能在速度和精度之间取得最佳平衡。
跑分Llama-3.1 70B-instructLlama-3.1-Nemotron-51B- Instruct准确率winogrande85.08%84.53%99.35%arc_challenge70.39%69.20%98.30%MMLU81.66%80.20%98.21%hellaswag86.44%85.58%99.01%gsm8k92.04%91.43%99.34%truthfulqa59.86%58.63%97.94%xlsum_english33.86%31.61%93.36%MMLU Chat81.76%80.58%98.55%gsm8k Chat81.58%81.88%100.37%Instruct Humaneval (n=20)75.85%73.84%97.35%MT Bench8.938.99100.67%
通过使用知识蒸馏技术，Nvidia 缩小了参考模型（Llama-3.1-70B）与 Nemotron-51B 之间的精度差距，同时显著降低了训练成本。
场景Input/Output Sequence LengthLlama-3.1- Nemotron- InstructLlama-3.1-70B-InstructRatioLlama (TP1)Chatbot128/1285478 (TP1)2645 (TP1)2.072645Text generation128/10246472 (TP1)2975 (TP4)2.171274Long text generation128/20484910 (TP2)2786 (TP4)1.76646System 2 reasoning128/40963855 (TP2)1828 (TP4)2.11313Summarization/ RAG2048/128653 (TP1)339 (TP4)1.92300Stress test 12048/20482622 (TP2)1336 (TP4)1.96319
附上参考地址

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

6000mAh+8T LTPO！魅族Lucky 08续航成绩史无前例

支付宝大升级：全球游客来中国也能“碰一下”了

华为Mate70系列预计11月发布其搭载纯血鸿蒙10月初开启公测

三星美国官网意外曝光新产品售价信息 4563元起9月底发布

5.0GHz！高通骁龙8 Gen5芯片细节曝光或使用三星2nm工艺

OPPO Find X8系列将于十月推出自研潮汐架构有望大幅提升能效

星纪魅族宣布推出全新品牌“STAR” 面向汽车和眼镜领域

美国加州立法：公立中小学校内限制或禁止使用智能手机

数据｜A股“破净”上市公司超700家，扎堆周期类行业

石头P20 Pro和G20S Ultra到底怎么选？一文看懂

A股起飞，妖股坠落

索尼的新款 PS5 Pro 预示着光盘驱动器的终结

电子竞技亚洲冠军联赛发布，或为亚洲规格最高国际电竞赛事

国家超算互联网平台入选2024世界计算大会“优秀成果”

沉浸式体验世界最新飞行模拟游戏即将上市

魅族推出 PANDAER Air Pro 3 半入耳降噪耳机：12.4mm 镀钛振膜单元，249 元

《黑神话：悟空》点燃山西旅游：搜索热度翻倍，暑假小西天门票订单增长了236%

第六届浦东新区长三角集成电路技能竞赛决赛暨颁奖仪式邀您参会！

《剑侠世界端游》周年资料片及周年新服爆料抢先看

【够级争霸】打够级赢3000元现金大奖“东泰置业杯”够级大赛火热报名中！

从这场智能客服魔法对抗赛上，我看到了AGI落地的正确姿势

2024阿里云云栖大会中小企业AI创新发展论坛上，这些值得关注

昨晚，高盛电话会被挤爆！关于中国资产爆发，高盛交易部门回答了五个客户最关心问题

AI产业规模将指数级扩张？贝恩预计3年内有望造就一个万亿美元市场

全世界的黄金值多少钱？新纪录来了：20万亿美元！

Xbox 游戏《微软飞行模拟 2024》上线 Steam，11 月 19 日发售

微软发布新工具，检测和纠正 AI 幻觉内容

全站最新

6000mAh+8T LTPO！魅族Lucky 08续航成绩史无前例

支付宝大升级：全球游客来中国也能“碰一下”了

中国天眼，再升级！

“陆地航母”飞行汽车、月球“土特产”将亮相中国航展

ST凯撒使用5000万元购买理财，拟被罚股民索赔征集进行中

携手海思，威路特X10 记录仪2025款重磅上市

腾势新款车型腾势N9新车谍照曝光，豪华SUV界再出新车，一起猜一猜价格吧

上市爆单却被拉横幅，有消费者质疑乐道“强扣定金”，客服：锁单后无法退定金

热门推荐

6000mAh+8T LTPO！魅族Lucky 08续航成绩史无前例

支付宝大升级：全球游客来中国也能“碰一下”了

华为Mate70系列预计11月发布其搭载纯血鸿蒙10月初开启公测

三星美国官网意外曝光新产品售价信息 4563元起9月底发布

5.0GHz！高通骁龙8 Gen5芯片细节曝光或使用三星2nm工艺

OPPO Find X8系列将于十月推出自研潮汐架构有望大幅提升能效

红米K80系列预计11月上市有望搭载2K纯直屏和6000mAh大电池

星纪魅族宣布推出全新品牌“STAR” 面向汽车和眼镜领域

美国加州立法：公立中小学校内限制或禁止使用智能手机

数据｜A股“破净”上市公司超700家，扎堆周期类行业

石头P20 Pro和G20S Ultra到底怎么选？一文看懂

名创优品想打造胖东来式的中国版山姆

A股起飞，妖股坠落

索尼的新款 PS5 Pro 预示着光盘驱动器的终结

月销过亿的“护腰神器”，直播间狂割打工人