在智能手机领域,华为率先引入了大模型技术,其他厂商纷纷效仿,小米推出轻量级语言大模型,vivo推出蓝心大模型,荣耀与百度智能云合作推出70亿参数平台级AI大模型,而OPPO也加入了大模型潮流。为手机带来了文本生成、知识查找、资料总结等复杂任务的执行能力。
然而,苹果似乎是唯一一家在智能手机上尚未正式推出大模型的厂商。对于iPhone何时搭载大模型能力,目前还没有确切消息。业内人士表示,苹果倾向于在充足准备后才正式推出新技术,类似于折叠屏的情况。
尽管苹果尚未公开大模型的详细路线,但根据他们发布的论文,他们似乎找到了一种突破方法。通过将模型参数存储在闪存中,在需要时再调入内存,解决了大型语言模型在终端设备上运行时内存不足的问题。这种方法包括窗口化技术和行列捆绑技术,有效推进了在内存有限设备上的大型语言模型推理。
与其他公司采用爬虫技术获取训练数据的做法不同,苹果选择了保守的路线。他们与新闻机构进行谈判,以获取新闻文章档案的授权,避免从互联网上获取信息。这种保守策略的好处是可以在更有针对性的信息集上训练人工智能模型,但也可能导致苹果大模型推出时间延迟。
在开源方面,苹果的Ferret多模态大语言模型以开源方式发布,为全球工程师提供了发展的平台。苹果还发布了MLX开发框架,使开发者能够轻松构建针对Apple芯片优化的机器学习模型。这一举措被认为是苹果在开源人工智能方面的最大举措。
苹果还在开发自己的生成式人工智能模型,名为“Ajax”,拥有2000亿个参数,将成为未来人工智能战略的核心。通过全栈自研体系,苹果在大模型时代可能同时具备软件和硬件的优势。据分析,苹果在AI服务器领域的投入将在2024年超过40亿美元,加速推动人工智能技术的发展。