图片来自视觉中国
12月23日讯(记者 武静静)昔日自动驾驶明星公司图森未来在经历退市等一系列风波后,已经重新选择了创业航向。
2024年8月,公司首次透露将瞄准AIGC方向,四个月后的12月17日,公司宣布启用全新品牌CreateAI,并发布了其首个图生视频大模型产品“Ruyi”。
目前,Ruyi-Mini-7B版本已经在huggingface上正式开源,用户可以从下载使用,据了解,“Ruyi”专为在消费级显卡(例如 RTX 4090)上运行。
从自动驾驶转向AIGC,好调头吗?
公司为何从自动驾驶迈向截然不同的视觉大模型赛道?
图森未来技术负责人在接受专访时告诉,此次转型主要是从公司转型和业务发展的角度出发。一方面,公司此前在做自动驾驶时已经在AI领域积累了算法、算力和数据经验;另一方面,联合创始人陈默在游戏圈有资源积累,有机会快速将技术落地。
陈默也在此前接受媒体采访时提到,图森未来在试图寻找一条更快能够依靠现有资源“救活”公司的路,随着视觉模型技术的不断推进和公开,AIGC成为在商业化空间、技术可达性方面都符合条件的一个目前的最佳选择。
据了解,图森未来做视觉模型的团队就是此前公司做自动驾驶的团队,一些技术经验可以复用。
图森未来技术负责人谈道,AI视觉模型和自动驾驶都依赖于算法、算力和数据这“三驾马车”来推动技术发展,且两者都依赖大量的数据进行训练和优化。而视频生成技术与自动驾驶中的感知模块非常相似,两者都以数据驱动为主,研发路径相对较短,依赖的技术基础也比较清晰。
在他看来, 自动驾驶技术涉及感知、定位、规划、控制等多个算法模块,以及软件系统、硬件设计、车辆结构设计等多个领域。相比之下,视频模型技术的研发路径更短,技术面更窄,主要集中在数据处理和模型训练方面。
“数据的重要性甚至超过算法,”图森未来技术负责人强调,他提到图森在自动驾驶领域积累了丰富的数据标注经验,拥有自建的标注团队和标注平台,并建立了完整的数据处理流程。 “这些经验和工具可以直接应用到视频模型的数据准备阶段,从而节省大量时间和成本。”
当然,在很多视觉模型的技术和效果上,图森还需要从零开始探索。目前,公司视频模型主要围绕五大关键指标进行:生成质量、一致性、可控性、易用性和成本。
图森未来技术负责人告诉,模型生成质量是首要目标, 确保生成的视频内容在画面、动作、细节等方面达到高水平。“公司采取螺旋上升式的研发策略,在保证生成质量和一致性的前提下,逐步提升模型的可控性、易用性和成本效益。”
图森选择第三条路:不靠模型赚钱,自己下场做内容
当下,视觉模型领域新进展不断,当地时间12月9日,美国OpenAI公司正式发布了最新版本的视频生成大模型Sora-Turbo,它能够根据文本、图像或视频输入生成新的视频内容。此外,国内市场,不论是字节、快手等大型科技巨头,还是创业公司Pika、爱诗科技、生数科技等都在持续有紧锣密鼓的推进技术和产品迭代。
图森的入局是否是想在竞争激烈的视觉大模型赛道分一杯羹?
从目前公司的业务进展和采访中得知,这个答案是否。图森未来技术负责人告诉,更准确的说法是,图森未来要成为一家内容公司而非大模型技术公司,和快手等平台以及Pika等创业公司的方向并不相同。
目前,市面上视觉大模型的商业模式无非两种:一类是Runway、Pika等公司,面向C端用户,提供付费的视频生成工具或服务,让创作者付费自制内容;另一类是面向B端影视文娱以及游戏等公司,帮助产业降本增效。
图森未来技术负责人向谈道,如果定位成纯粹的视频模型公司,to C和to B都存在明显挑战:
一方面,to C方向,视频生成工具的目标用户群是专业创作者,而非普通大众,收费模式和盈利前景都不明确,且视频模型需要大量的算力支持,运营成本高,国内市场,很难在短期内依靠收费,吸引用户并实现盈利。
另一方面,单纯面向B端的技术赋能落地挑战巨大,因为技术公司很难深入了解具体场景的需求,也很难将技术有效地融入到实际的制作流程中,控制内容的质量和风格。
相比很多视频模型正在将重心瞄准在追求技术的通用性上,图森选择了不一样的第三条路:直接把模型技术开源,不靠模型赚钱,并购入了经典IP,自己下场用大模型做内容。
据了解,公司目前有专门的动漫和游戏团队已经在开发新项目。
“我们希望打造一家以AI技术驱动的视频内容创作公司,打造端到端的视频内容生成链条。最终通过优质内容来吸引用户和实现商业价值。”图森未来技术负责人说道。“技术只是工具,最终的目标是为用户提供内容。”
目前,图森已经布局动漫、游戏板块,其全新品牌CreateAI已经获著名武侠IP《金庸群侠传》正版授权,将开发一款大型武侠开放世界RPG游戏。2024年8月,公司也官宣了和上海三体动漫有限公司达成合作,共同开发《三体》系列的首部动画长篇电影和视频游戏。据悉,公司也会在12月推出 SLG 游戏工具和游戏本身。
“我们现在拥有「金庸群侠传」和「三体」这两个顶级 IP,我们的目标是在 2027 年实现 10 亿美元的收入。”陈默在最近一次接受采访时说到了图森在AIGC方向的未来目标。