今天分享的是:AIGC助力大规模对象存储服务OSS的能效提升
报告共计:17页
这份文档由阿里巴巴资深技术专家罗庆超在 QCon 全球软件开发大会上分享,主题为“AIGC 助力大规模对象存储服务 OSS 的能效提升”。
文档指出大规模对象存储服务 OSS 在开发运维中面临海量存储量、巨量请求及多租户等挑战,目标是达成 99.995%可用性 SLA,并实现简单快捷的易用性。为应对这些挑战,结合 AI 的智能运维成为关键,包括通过 AI 做好根因分析支撑可用性 SLA 达成,其逻辑架构涉及多个模块和算法,能够快速完成错误分析和添加新检查项,提升根因发现和问题诊断效率;智能分析访问全链路追踪慢请求,通过多维度监控和分析,实现对慢请求的精准定位和原因分析;采用 NLP 分析海量工单挖掘改进方向,经过数据清洗、智能训练和迭代优化,提高工单分类准确率,节约人工标注开销;探寻 AIGC 的智能机器人提高易用性,利用 AIGC 训练智能机器人,为用户提供文字、图片、视频等多种形式的服务,降低工单数量和服务人力投入。
最后总结指出,通过 DataOps 积累海量运维数据是走向智能运维的必经之路,在高频问题上采用智能运维能带来较大收益,虽然智能运维面临诸多困难,但只要持续努力就能取得成效。
以下为报告节选内容