据悉,华为公司即将推出一款名为“盘古 Chat”的多模态千亿级大模型产品,直接对标 ChatGPT。该产品基于华为云内部项目,于2020年11月立项成功,主要面向To B / G 政企端客户。
盘古大模型基于华为自研的MindSpore框架开发,参数最多可达1.085万亿。此前,盘古大模型已经在2021年4月和2022年4月分别升级到2.0版本和3.0版本。其中,NLP大模型、CV大模型以及科学计算大模型(气象大模型)均已被标记为即将上线状态。
盘古CV大模型是业界最大的CV大模型,兼备判别与生成能力,并在ImageNet上实现了小样本学习能力业界第一。此外,盘古气象大模型可以提供秒级天气预报,而紫东.太初则是全球首个图、文、音三模态大模型。
华为内部团队确立了三项最关键的核心设计原则:一是模型要大,可以吸收海量数据;二是网络结构要强,能够真正发挥出模型的性能;三是要具有优秀的泛化能力,可以真正落地到各行各业的工作场景。
盘古大模型由NLP大模型、CV大模型、多模态大模型、科学计算大模型等多个大模型构成。这些模型可以支持多种自然语言处理任务,包括文本生成、文本分类、问答系统等。通过模型泛化,盘古大模型解决了传统AI作坊式开发模式下不能解决的AI规模化、产业化难题。
据悉,盘古Chat预计将于今年7月7日举行的华为云开发者大会 (HDC.Cloud 2023) 上对外发布及内测。这款产品将为政企端客户提供更为便捷的AI服务,助力数字化转型。