走进位于河套科技创新合作区的一栋写字楼内,深圳鲲云信息科技有限公司创始人、CEO牛昕宇正与小伙伴们讨论着芯片架构、代码优化等内容。室外阳光和煦,室内氛围热烈,两者相映成趣,交织成一幅创新创业的生动图景。
作为全球首家实现规模化商业落地的创新架构AI芯片企业,鲲云在可重构数据流AI芯片领域已处于全球领跑地位。在牛昕宇看来,积极追求创新、敢于拥抱变化的深圳,为人工智能企业提供了生根发展的动力和信心。“创业是长跑,AI是长跑,芯片更是长跑,深圳正适合这种长跑。”
把前沿技术落地深圳
留在国外潜心科研,抑或回国投身创业?牛昕宇选择的是后者,一条在彼时看来未可知的道路。2017年,牛昕宇放弃在国外著名高校任教的机会,与几位合伙人回国拉起创业大旗,在深圳创立了鲲云科技。
当时沿着海外巨头的成熟技术路线打造AI芯片仍是热潮,但牛昕宇另辟蹊径,不再跟随巨头们的成熟技术路径。他心中有一个目标,就是用全新的可重构数据流架构,打造一颗真正自主创新的AI芯片。“要想超越他们,就不能成为他们。”
可重构数据流架构是一种基于可重构的空间连接关系定义计算次序的计算架构方式。举例而言,它就像工厂流水线,将材料送上传输带后,每个环节的工人即可不间断完成工作。与之相比,传统芯片商多数采用的是指令集架构——虽然靠一个熟练工可以自己完成所有工序,但需要花大量时间在材料搬运和组装上,导致效率较低。
“由于各类人工智能算法不同,需要的计算组合也就不同,因此芯片需要有重构能力来形成不同的流水线,才能压掉所有冗余,达到极致的、最高效率的生产。”牛昕宇坚信,可重构数据流技术有着深厚潜力,和对算力性能的巨大提升价值,这是一条没有人走过的、虽难而正确的道路。
“全球首款”成功量产
2020年,鲲云发布了全球首款数据流人工智能芯片CAISA3.0,依托于28nm制程,可达到海外巨头同类对标产品最高4.12倍的实测性能。
这背后是道阻且长的艰辛。研发期间,牛昕宇和团队的工作强度拉满,有人在办公室里通宵调试,有人在实验室里研究流片方案,让他印象最深刻的,是第一颗芯片的流片成功。“CAISA架构能让芯片利用率达到95.4%,但理论模型跑通,不代表芯片可以量产,一旦流片失败,就意味着数千万研发资金可能打了水漂。”
就在当年的一个夏夜,牛昕宇和团队终于守得云开——他们全神贯注守着测试仪器,看着第一颗CAISA芯片运行。几秒钟后,数据流动起来,测试画面出现,参数曲线符合预期。
没有全场沸腾庆祝,也没有预想中的欢欣鼓舞,牛昕宇只是长出一口气,并和伙伴们相互点了点头,随即又开始准备进行下一轮测试。振奋敛于心,这或许正是属于一线科研人、创新者们独有的浪漫情怀。
2023年底,鲲云再次迎来重要节点,发布了基于第四代可重构数据流架构技术研发的CAISA430芯片并于2024年实现量产。该产品实测性能、通用性等关键指标实现跨越性提升,端到端芯片利用率最高可达90%,有效算力指标表现突出,可为计算机视觉、语音语义及大模型应用提供高性能、低延时、高算力性价比的AI算力支持。
于创新之城听到“回响”
“我们自身定位于‘提供下一代计算平台及加速人工智能落地’。做出芯片只是第一步,真正的挑战是如何让它走出实验室,被市场接受,为使用者创造价值。人工智能是新一代的生产力,我们希望能够在千行百业的场景中推动它加快落地。”牛昕宇说。
以可重构数据流AI芯片技术为核心,目前鲲云已为智慧城市、智慧能源、智能制造等领域提供成熟易用的AI算力服务和行业解决方案,落地项目超过5000个。例如,在智慧工地建设上,鲲云打造出算法、算力、平台一体化的AI视频分析解决方案。可实时进行吊篮空载超载识别、起重机作业半径站人识别、防护栏缺失识别、渣土车车位脏污和盖板抬起识别等,助力工地提升数字化安全管理水平。
“AI技术如果不能落地,就很难获得长久的发展。深圳的优势在于它既务实,又鼓励创新,愿意给技术一个试验场。”热爱运动的牛昕宇如今依然保持着夜跑的习惯。有时候,他会从河套出发,跑过科技园,再沿着滨海大道跑回来。深圳的夜晚灯火通明,他喜欢在跑步时思考当前遇到的挑战和解决思路。
面临过芯片研发的压力和企业推广的困难,也经历过从小团队到规模化落地的转变。深圳为牛昕宇和鲲云提供了一个可以试错、可以验证、可以快速落地的环境。“这里是一个愿意给新技术机会的地方,也是一个愿意把技术做成产业的地方。在深圳,我能够清晰听到技术和产品创新在市场的回响,这是一个不会让奋斗者失望的城市。”
码上读 更精彩
(记者 张程)