作者 | 邓咏仪
编辑 | 苏建勋
获悉,AI初创公司「硅基流动」(SiliconFlow)近日完成近亿元天使+轮融资。本轮融资由某知名产业方领投,跟投方包括智谱AI、360和水木清华校友基金等知名企业及机构,老股东耀途资本继续超额跟进,华兴资本担任独家财务顾问。
对本轮融资,创始人兼CEO袁进辉表示:“非常感谢各位投资方对硅基流动的信任和支持。这次融资将帮助我们进一步加快产品创新,为开发者提供触手可及的AI云服务,促进AI应用层的繁荣,推动AGI技术普惠化。”
硅基流动是一家专注于AI Infra(AI基础设施)领域的创业公司,成立于2023年8月。创始人袁进辉是前OneFlow(一流科技) 创始人及CEO,曾任微软亚洲研究院主管研究员,获得微软亚洲研究院院长特别奖。
通俗地理解,硅基流动所在的AI Infra层,是上接AI应用层、下接算力芯片层的中间层,相当于大模型时代的“操作系统”。如何让大模型训练与推理更高效,充分释放底层硬件的潜力,降低生成式AI应用开发的门槛与成本,正是AI Infra需要解决的关键问题。
大模型训练包括对模型进行参数调优、数据训练等环节,让模型具备执行相应任务的能力;而推理则是在模型训练好之后,让模型进行预测与决策的过程,为AI应用提供智能能力。
其中,深度学习训练框架是AI Infra的重要组成部分。这个领域被大公司的开源产品所主导,典型框架有Facebook的PyTorch,谷歌的TensorFlow,国内有百度的PaddlePaddle等。从2016年开始,作为世界范围内研发工业级通用深度学习框架的唯一创业团队,袁进辉带领的OneFlow团队推出了高性能分布式深度学习框架。
之所以敢挑战以大厂主导的AI训练框架生态,是因为袁进辉确信:未来AI模型的参数量会越来越大。一旦模型变大,那么原有的深度学习框架不能满足开发者的需求,底层的AI框架就需要重构,而这是属于创业公司的机会。
随后,以GPT为代表的大模型热潮来临,OneFlow团队所积累的大模型训练技术和认知得到验证。2023年,处在大模型风口上的OneFlow团队被原美团联创王慧文所创立的大模型公司“光年之外”并购,随后,“光年之外”因故被美团并购,袁进辉带领团队创立新公司“硅基流动”。
再次出发,硅基流动依旧将方向定在AI Infra赛道。只是,随着大模型走入大规模应用落地时期,推理效率成为阻碍生成式AI应用成功的一大技术挑战。因此,硅基流动的技术方向瞄准了大模型推理领域。
英伟达在2023年财报电话会后透露,在过去的四个季度中,英伟达数据中心约40%的收入都是推理需求驱动的。而根据Gartner的报告,2023年专用于AI工作负载的芯片创造近534亿美元的收入;到2027年,这一数字将达到1194亿美元。这无疑是一个具有巨大商业前景的方向,当然,也是大公司和创业公司的必争之地。
袁进辉对表示,他希望能够带领硅基流动,在技术领先的基础上,重点解决上一次创业没有解决好的挑战——走通商业化闭环。
6月,硅基流动正式推出了新产品 —— 一站式大模型API云服务平台SiliconCloud,汇聚了诸多主流大模型,如阿里旗下的通义大模型Qwen2、智谱旗下的GLM-4、幻方量化旗下的DeepSeek V2系列开源模型,以及文生图模型SDXL、SDXL Lightning、PhotoMaker、InstantID等。
基于硅基流动在AI Infra领域的深厚积累,SiliconCloud平台上的大模型响应速度更快,算力成本更低,大大提升了AI 应用开发效率,并大幅降低了部署成本。比如,使用SiliconCloud调用文生图模型Stable Diffusion,可以达到1秒出图;而调用大模型DeepSeek V2,响应速度可达50 Tokens/s。这是因为SiliconCloud集成了其图片/视频生成推理引擎OneDiff,可以让文生图模型SDXL的最高可达3倍性能加速;同时,SiliconCloud还集成了大语言模型推理引擎SiliconLLM,在各类语言大模型推理场景中,其最高性能加速可达同类开源产品的10倍。
袁进辉对表示,目前国内大厂旗下的大模型每天生成Token量在千亿级别,而SiliconCloud上线公测后,平台的调用量就迅速增长。“仅仅几周后,每天的Token生成量达到了数十亿。”他说。
近期,硅基流动也利用技术优势提供更低价格的模型服务。6月25日,他们正式宣布SiliconCloud平台的Qwen2(7B)、GLM4(9B)、Yi1.5(9B)等顶尖开源大模型免费使用,开发者真正实现“Token自由”。
当前,硅基流动的产品已在多个行业中广泛应用,并且被业内顶级云厂商、芯片公司和大模型公司相继认证为最高等级合作伙伴。对于以后的市场发展计划,袁进辉表示,公司将会同步拓展海外市场。