当前位置：首页 » 资讯 » 新科技 » 正文

Meta公布MobileLLM 1.5B参数量大、性能强

IP属地北京 编辑：孙雅中关村在线 时间：2024-11-08 19:00:27

11 月 8 日，meta 公布了他们在智能手机上运行的 Small Language Model (MobileLLM) 家族的开源计划。他们新增了 600M、1B 和 1.5B 三种不同参数版本，这是为了适应用户对高效表现的需求。据 meta 的研究人员介绍，MobileLLM 模型家族采用了精简架构，并引入了“SwiGLU activation function”和“grouped-query attention”机制，以实现兼顾效率与表现成果的目标。
与此同时，meta 研究人员称，在32颗Nvidia A100 80G GPU服务器环境下进行的实验表明，MobileLLM 1.5B 版本仅需18天就能完成训练任务，而125M 版本只需3天。从结果来看，MobileLLM 125M和350M两款模型在零样本常识理解任务中的准确率比Cerebras、OPT、BLOOM等State of the Art（SOTA）模型分别高出2.7%和4.3%。
meta的研究人员还表示，他们将MobileLLM-1.5B与其他业界参数量更大的模型进行了比较，并发现其在测试结果方面领先于GPT-neo-2.7B、OPT-2.7B、BLOOM-3B、Qwen 1.5-1.8B等模型。

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

“文旅智变，科技绘景”——《钛度热评》AGI首期线下沙龙在京成功举办，共探科技赋能文旅新路径

曝传音智能戒指即将面世包含多项健康和健身功能

OneXPlayer 飞行家 F1 Pro EVA 联名游戏掌机发布，9399 元起

消息称三星明年 4 月推出 Galaxy S25 Slim“超薄手机”

三星S25 Ultra最新渲染图曝光厚度减薄R角设计更圆润

百度或推内置小度AI助手智能眼镜预计售价低于2139元

苹果将高性能模式扩展至M4 Pro芯片设备此前仅限于Max机型

微软官网下载渠道发出Win10支持将止警告力促用户升级至11

华为Pura80系列预计明年Q2发布潜望长焦有望迎来新变化

谷歌将推出Gemini AI模型2.0更新提高响应速度

摩托罗拉获卷帘屏手机新专利实现屏幕任意位置指纹解锁

智谱发布新清影AI模型支持生成10秒带音效4K 60帧视频

字节跳动Seaweed模型开放使用 60秒生成5秒AI视频

龙腾世纪4销量扑街玩家大量退款

酷凛雪界DX无风扇水冷散热器上市白色款仅售259元

无尽的求生欲！丧尸围城豪华复刻版试玩版来了

美女COSER公开《原神》久岐忍Cosplay作品！

索尼发布财报：PS5出货量同比减少，游戏业务营收暴增

创新散热设计！ APNX推出超酷炫中塔机箱产品

合金弹头：战略版游戏测评 10位玩家好评如潮

《宝可梦TCG Pocket》全球下载量突破3000万

守望先锋公测10周年暴雪发文纪念

4499元起荣耀Magic7系列首销爆单：销售成绩远超预期

《如龙8外传》新角色配音演员青木崇高加盟出演

一加极木随行杯开售：350 毫升容量保温 6 小时，129 元

AGM Buds 3 耳机发布：支持 ANC + ENC 降噪，99 元

时隔两个月！A股再现停牌核查，七连板“牛股”大涨近260%

全站最新

“文旅智变，科技绘景”——《钛度热评》AGI首期线下沙龙在京成功举办，共探科技赋能文旅新路径

曝传音智能戒指即将面世包含多项健康和健身功能

OneXPlayer 飞行家 F1 Pro EVA 联名游戏掌机发布，9399 元起

消息称三星明年 4 月推出 Galaxy S25 Slim“超薄手机”

三星S25 Ultra最新渲染图曝光厚度减薄R角设计更圆润

百度或推内置小度AI助手智能眼镜预计售价低于2139元

苹果将高性能模式扩展至M4 Pro芯片设备此前仅限于Max机型

微软官网下载渠道发出Win10支持将止警告力促用户升级至11

热门推荐

“文旅智变，科技绘景”——《钛度热评》AGI首期线下沙龙在京成功举办，共探科技赋能文旅新路径

曝传音智能戒指即将面世包含多项健康和健身功能

OneXPlayer 飞行家 F1 Pro EVA 联名游戏掌机发布，9399 元起

消息称三星明年 4 月推出 Galaxy S25 Slim“超薄手机”

三星S25 Ultra最新渲染图曝光厚度减薄R角设计更圆润

百度或推内置小度AI助手智能眼镜预计售价低于2139元

苹果将高性能模式扩展至M4 Pro芯片设备此前仅限于Max机型

微软官网下载渠道发出Win10支持将止警告力促用户升级至11

华为Pura80系列预计明年Q2发布潜望长焦有望迎来新变化

谷歌将推出Gemini AI模型2.0更新提高响应速度

摩托罗拉获卷帘屏手机新专利实现屏幕任意位置指纹解锁

智谱发布新清影AI模型支持生成10秒带音效4K 60帧视频

字节跳动Seaweed模型开放使用 60秒生成5秒AI视频

龙腾世纪4销量扑街玩家大量退款

酷凛雪界DX无风扇水冷散热器上市白色款仅售259元