当前位置: 首页 » 资讯 » 新科技 » 正文

Meta今年压轴模型Llama 3.3登场:700亿参数,性能比肩4050亿

IP属地 北京 编辑:钟景轩 IT之家 时间:2024-12-07 16:14:28

12 月 7 日消息,meta 今年的压轴 AI 大模型来了。meta 昨日(12 月 6 日)发布 Llama 3.3,共有 700 亿参数,不过性能方面媲美拥有 4050 亿参数的 Llama 3.1。

meta 强调 Llama 3.3 模型效率更高、成本更低,可以在标准工作站上运行,降低运营成本的同时,提供高质量文本 AI 解决方案。

Llama 3.3 模型重点优化了多语言支持,支持英语、德语、法语、意大利语、葡萄牙语、印地语、西班牙语和泰语 8 种语言。

在架构方面,Llama 3.3 是一款自回归(auto-regressive)语言模型,使用优化的 transformer 架构,其微调版本使用了监督式微调(SFT)和基于人类反馈的强化学习(RLHF),让其与人类对有用性和安全性的偏好保持一致。

Llama 3.3 上下文长度为 128K,支持多种工具使用格式,可与外部工具和服务集成,扩展模型的功能。

安全方面,meta 采用数据过滤、模型微调和系统级安全防护等措施,以降低模型滥用的风险;此外 meta 鼓励开发者在部署 Llama 3.3 时采取必要的安全措施,例如 Llama Guard 3、prompt Guard 和 Code Shield,以确保模型的负责任使用。

附上参考地址

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。

全站最新