记者 贾天荣
近日,亚马逊云科技re:Invent 2024中国行全国巡展开启,为北京、上海、深圳等城市的企业和开发者带来一站式技术盛宴。亚马逊云科技在2024 re:Invent全球大会上发布一系列以覆盖基础设施、模型和应用的全栈联动创新助力企业应用生成式AI,全面重塑客户云上创新体验。
“一直以来在技术领域存在这样一个既定现实与趋势:没有一个大模型能‘包打天下’,包办所有任务。”亚马逊云科技大中华区解决方案架构总经理代闻在上海站活动上表示,必须依据不同的应用场景,灵活选用不同的模型,实现在多模型统筹管理之下,为不同的智能体精准赋能。
亚马逊云科技此次发布聚焦生成式AI、数据战略和云服务三大领域:在生成式AI领域,推出Amazon Nova系列基础模型并强化Amazon SageMaker、Amazon Bedrock和Amazon Q等核心服务,通过更低的训练和推理成本、更多的模型选择、更深入场景的应用,全面加速企业应用生成式AI创新;在数据战略方面,发布新一代Amazon SageMaker为数据、分析和AI提供统一平台;同时,Amazon S3新增Tables存储类型和元数据功能,以及无服务器分布式SQL数据库Amazon Aurora DSQL将进一步提升用户的数据管理能力;在云服务方面,推出搭载Trainium2芯片的新型计算实例和为万亿参数模型提供实时推理性能的超级服务器。
作为发布亮点之一,Amazon Nova系列基础模型成为全球领先的AI技术解决方案,包括Nova Micro、Nova Lite、Nova Pro和Nova Premier基础模型,以及用于生成高质量图像的Nova Canvas和生成高质量视频的Nova Reel。在各自智能类别中,Amazon Nova Micro、Lite和Pro应用成本比Amazon Bedrock中表现最佳的模型至少降低75%,同时也是Amazon Bedrock中对应类别速度最快的模型。
会上,亚马逊云科技表示,当前,越来越多的客户不再孤立地使用不同的数据分析工具,相反,他们正在将分析、机器学习和生成式AI相结合来获取洞察。
为此,新一代Amazon SageMaker包括一个新的、统一的工作室,为客户提供一个单一的数据和AI开发环境,用户可以在其中查找和访问其组织中的所有数据,为各种常见的数据用例选择最佳工具,并将数据和AI项目扩展至团队内不同分工角色以实现协作。
在当前全球大规模计算集群中,能源消耗已成为重要议题。代闻表示,当前电力已经成为一种非常稀缺的资源。在很多海外地区,电力和碳排紧密相连,因此服务器的综合成本不仅取决于价格,还包括能效表现。在规定能耗范围内提升算力,不仅有助于企业节约成本,更有助于实现碳排放的减量化目标。
因此,对于有在海外进行工作负载部署、开展机器学习工作负载部署计划的用户,他强烈建议关注能效这一方面的问题。
记者了解到,亚马逊云科技推出了创新的数据中心设计方案,通过简化电力分配和机械系统,实现基础设施可用性达99.9999%,将受电气问题影响的机架数量减少89%。创新的“液体到芯片”冷却系统无缝集成空气和液体冷却功能,机械能耗降低46%。全新设计让每个站点提供增加12%的计算能力,同时在可持续性方面取得重要突破,采用可再生柴油作为备用发电系统燃料,与传统化石柴油相比温室气体排放可减少90%,数据中心建筑的混凝土固有碳排放量较行业平均水平最高可降低35%。
此外,亚马逊云科技还预发布了Amazon Trainium3的芯片。首款Amazon Trainium3的芯片将采用3纳米的制程工艺,其计算速度将提高两倍,并且能效可以提升40%以上。
“生成式AI在很多情况下是由用户业务侧反向推动产生需求,进而积极推动了整个技术栈往前演进。”代闻举例,此次发布的Trainium2芯片是一款专为生成式AI设计的原生芯片,而Amazon Bedrock和Amazon Q则分别面向大模型管理和生成式AI的场景化应用,体现了技术创新与需求联动的趋势。在需求侧推动、技术侧创新以及多层联动之下,构建和使用环境正逐步朝着为生成式AI赋能的路径发展。