10月15日,据大数据技术标准推进委员会官方公众号消息,中国信通院组织的首批大模型驱动的智能数据开发平台专项测试完毕,腾讯云成为首个完成此项测试的企业。这意味着AI大模型加持下的数据治理智能体验已开始走向企业实际的业务场景。
《大模型驱动的智能数据开发平台技术要求》标准及测试简介
数据开发是挖掘数据资产价值的核心工作,涵盖数据模型开发、ETL流程、数据分析处理、任务调度等全生命周期。但一直以来存在环节流程复杂,对从业人员要求门槛高等痛点。
大模型的驱动,有望降低数据开发治理门槛。基于此,中国信通院云计算与大数据研究所依托中国通信标准化协会大数据技术标准推进委员会,联合腾讯云等40余家企业共同参与起草,参考各行业数据开发实践经验,发布《大模型驱动的智能数据开发平台技术要求》标准。
该标准包含9大能力域,共33个能力项,90余条能力细则。对大模型技术应用在数据资源管理、平台资源管理、数据模型开发、智能化数据准备等九大方面提出建设框架和参考指引。
作为该标准的核心参编单位,腾讯云旗下的智能数据开发平台WeData成为首个通过测试的产品,包含数据集成、开发、测试、运维的全链路DataOps数据开发能力,以及数据建模、数据质量、数据安全、数据资产等一系列数据治理和数据运营能力,能帮助企业在数据构建和应用的过程中实现降本增效,数据价值最大化。
腾讯云WeData在产品能力上通过两大方向推进大模型与数据开发治理的融合。一方面, 腾讯云WeData通过于AI技术的深度融合,将智能化引入SQL开发效率、数据血缘分析、数据资产管理、数据安全防护四大方面,进一步提升数据开发和治理的效率,优化用户体验。
例如,基于腾讯混元大模型,腾讯云WeData打造了智能助手功能,帮助用户快速排错、解释和注释SQL语句,显著提高开发效率,让即使不是专业的数据分析员也能操作。
另一方面,腾讯云WeData还能为AI大模型全生命周期的数据质量与安全提供能力支持。通过一站式大数据+AI解决方案,WeData覆盖了从业务需求到数据加工、清洗、模型服务的全过程;与腾讯云Ti-One机器学习平台集成,支持模型训练任务的编写与调试,统一调度编排大数据处理、机器学习以及Notebook等任务,实现数据开发全流程的高效管理。
WeData基于混元大模型与腾讯云ElaticSearch(ES)的整合,提供企业专属模型微调和知识库构建服务,尤其在泛互联网和金融等领域,通过向量化存储与RAG技术,显著提升大模型问答准确率,确保数据质量、提高企业的数据治理能力。
大模型与数据治理融合带来的全新用户体验正在受到重点关注,在近期IDC发布的《中国数据治理市场份额, 2023:为GenAI做好准备》中,腾讯云WeData,在中国数据治理平台市场中市场份额位列第二,增长率第一。