文 | 乌鸦智能说
今年6月,The Information 邀请了著名风险投资家、OpenAI 早期投资人Vinod Khosla和大家探讨了对AI技术发展的见解,讨论了AI如何重塑人机交互、创业生态系统以及专业服务的未来。
Vinod Khosla是一位著名的印度裔美国企业家和投资者。他不仅是风险投资公司Khosla Ventures的创始人和董事长,也是OpenAI的首位投资人。
在本次访谈中,Vinod Khosla分享了很多有价值的观点。以下是乌鸦君摘选Vinod Khosla的部分核心观点:
1.大模型一年后的成本会是今天的五分之一到十分之一。我建议所有初创企业忽略计算成本,因为你在优化软件上花的任何钱,一年内都会变得毫无价值。
2.在云计算基础设施上投资并不明智,因为那些购买GPU来构建云计算的公司很可能会输给亚马逊和微软这样的巨头。
3.所有这些应用都会依赖于针对特定领域优化的大型语言模型。几乎所有的专业知识都将被AI免费化,无论是初级保健医生、教师、结构工程师还是肿瘤学家,每个专业领域都可能成为成功的创业项目。但在这个过程中,细分领域的专业知识最终会被整合到更广泛的领域,比如初级保健和心理健康治疗。
4.AI将带来巨大的通货紧缩,因为许多东西的成本将接近于零,这些东西中的劳动力含量已经消失了。如果你减少到仅剩20万名医生,80%的医生消失,消费者在医疗保健上少花费2500亿美元,带来通货紧缩。
5.在可能出现通缩的AI经济中,人类可能会为体验支付更高的价值。我不认为Taylor Swift仅仅是关于音乐,这是一种文化现象,一种年轻人的体验。
苹果公司的最新动作
Jessica Lessin:我认为这周又有了重大AI新闻,苹果的AI发布,当然,其中一个重要部分是苹果与OpenAI的合作。Vinod是最早的风险投资者。所以我得问问Vinod,你对苹果的消息怎么看?
Vinod Khosla:首先,我还没有完全跟进所有的消息,这周末再看。但苹果确实需要做点什么,Siri的声誉已经越来越差了,甚至可能更差。
但更重要的是,他们展示了一件非常重要的事情:计算机直接与你交互。你不需要费劲从计算机获取信息,计算机会为你获取信息。我几个月前写了一篇博文,讨论了计算机将学习人类而不是人类学习计算机的看法。
从OpenAI的角度来看,这明确了OpenAI最佳大语言模型的地位。显然,很多人想要这个业务,很多事情都被评估过。所以很高兴看到苹果认为最好的AI在OpenAI,我相信他们也考虑了未来一年或两年最好的AI会在哪里。所以在很多方面,这对OpenAI来说是一个验证,也是人类与机器交互方式的一个重要里程碑。
Jessica Lessin:我得补充一点,我认为他们确实提到了Gemini也即将到来,可能还会与Anthropic合作。我提到这一点不是为了贬损OpenAI的优秀模型,而是因为它引发了我一个问题,那就是如果苹果试图用这种智能技术重建一个应用商店,目标是广泛合作并引导到不同的服务,这让我想起他们最初推出Siri时说的,他们会将你引导到OpenTable进行预订等等。Vinod,你对苹果的技术走向或者更广泛地说,AI中应用和服务的发现有什么看法吗?因为这直接关系到创业生态系统。
Vinod Khosla:首先,苹果保留选择余地是明智的,但他们确实在嵌入和内置到操作系统中的选择做了明确的决定,足以让Elon Musk因为禁用苹果设备而生气。但我认为更大的事情是我们如何与计算机交互。Siri是人机交互界面进化的开始,最终会变成代理型界面。我认为这是大新闻。
Sam Lessin:Vinod,我能问你一个问题吗?你和我去年曾讨论过大模型与小模型的未来。苹果展示的一个有趣点是他们能在设备上用小模型做很多事,那么长期来看,昂贵且竞争激烈的大模型会占据什么地位?它们只是变成内容吗?我有点好奇,尽管你还没完全跟进,你怎么认为这一切会发展?
Vinod Khosla:我认为设备上的小模型做的事情会与大模型做的事情不同。如果你想要人类水平的智能,那就得使用大模型,小模型取代不了大模型,但它们确实在某些方面做得很好。如果你想要低延迟的响应,你需要一个短路径,那就需要设备上的小模型。实际上,我认为英特尔甚至与其新处理器一起捆绑了一个小的大语言模型,但它们旨在做响应性界面,而不是智能来源。
Sam Lessin:你可以想象一个未来,你可以和很多人对话,有些人智商50,有些人智商100,有些人智商10000。问题是,你愿意花钱向智商10000的人提问还是向智商70的人提问,后者可能知道你的邮件内容和日常问题。现在我们基本上相当于把所有问题都抛给一个非常昂贵的博士生。而未来,我认为我们会更聪明地选择不同问题需要什么水平的智能。你怎么看这种竞争?
Vinod Khosla:我可能不同意。我认为“昂贵的大模型”会变得非常便宜。我打赌一年后它的成本会是今天的五分之一到十分之一。我建议所有初创企业忽略计算成本,因为你做的任何假设,你在优化软件上花的任何钱,一年内都会变得毫无价值,所以忘记它。依赖云、Gemini和OpenAI之间的市场竞争来降低成本到无关紧要的程度,低到某个水平就无所谓了。你每月为iPhone服务支付一定费用,如果这费用是其中的10%或更少,那就无关紧要。
Jessica Lessin:为什么你认为公司应该忽略成本,它会如此剧烈地下降?你看到了什么?
Vinod Khosla:因为每个大模型所有者都在努力降低成本。
Sam Lessin:每个大模型的训练成本不是越来越高吗?
Vinod Khosla:AI模型的训练成本确实日益增高,这也是我认为开源模型难以持续的原因。然而,一旦模型训练完成,我们应该追求最广泛的使用范围,这有两个主要原因:首先,从商业角度来看,我们希望获得最多的收入。成本最低的模型通常能获得最广泛的应用,从而带来最高的收入。但更为重要的是,广泛使用能够产生大量数据,这些数据对训练下一代模型至关重要。因此,出于多方面考虑,我们应该致力于最大化模型的使用范围。
如果我们着眼于长远发展,就会发现AI模型竞争主要在五年的时间尺度上进行,而非一年。在这段时间内,成本会逐年下降。目前,Nvidia从每个用户那里收取相当高的费用,但未来每个模型都将能够在多种类型的GPU或计算平台上运行。
开发者们会希望生成尽可能多的数据。因此,我相当确信在未来几年里,收入并非最重要的指标。当然,我们不希望亏损到无法承受的地步,但主要目标并非赚取巨额利润,而是获得大量使用和数据以改进模型。
我坚信AI在智能方面还有很大的提升空间,无论是推理能力、概率思维还是模式匹配,这些模型在各个方面都有巨大的改进潜力。我相信我们每年都会看到令人惊叹的进步。虽然业界有许多传闻,但公司之间主要区别在于执行力。例如,OpenAI在执行方面表现出色,而谷歌拥有优秀的技术和人才,但在执行精准度上略显不足。
Brit Morin:有些人认为AI最终会被现有的科技巨头垄断并商品化。Vinod,从五年的时间尺度来看,你对AI的前景有什么看法?你更关注哪些不太可能被巨头垄断的领域?这种思考方式合适吗?
Vinod Khosla:我认为,如果你想与OpenAI和谷歌等公司在基础模型领域竞争,这并不是一个好的方向。大型语言模型很可能会被大玩家主导,因为他们有能力在大规模集群上进行训练,可以支付专有内容的费用,比如与Reddit等平台合作,并能够访问Nature等出版物中的各种科学文章。如果沿袭传统路线,大玩家确实具有优势。
然而,我们最近投资了一家名为符号逻辑的公司,他们采用了完全不同的方法。这种方法不依赖于大量数据或计算资源,是一条正交的、高风险高回报的路径。如果成功,将带来革命性的变化。因此,即使在模型层面,也存在着不同的创新方向。
例如,我的MIT教授朋友Josh Tenbaum认为,概率编程将是未来的一个重要贡献。人类的思维方式是基于概率的,这与简单的模式匹配不同。所以我认为我们在基础技术研究方面还远未结束。目前,我们主要在开发Transformer模型,但还有其他模型值得探索。只是很少有人敢于投资Transformer以外的模型。
我特别关注那些看似深奥的领域。比如,符号逻辑使用了一种叫做范畴理论的数学,这是大多数数学家都不太熟悉的。这是我们在15-18个月前做出的一个大胆投资。
在模型之外,还有很多值得关注的领域。我认为在云计算基础设施上投资并不明智,因为那些购买GPU来构建云计算的公司很可能会输给亚马逊和微软这样的巨头。这些大公司正在开发自己的定制芯片,以避免支付Nvidia的高额费用,而且几年后AMD也可能加入竞争。但在应用层面,机会是巨大的。我预测,几乎所有的专业知识都将被AI免费化。无论是初级保健医生、教师、结构工程师还是肿瘤学家,每个专业领域都可能成为成功的创业项目。
当然,我们也投资了一些大家都知道的非常受欢迎的项目,比如Devin,他们正在构建一个AI程序员。他们不是在为程序员构建工具,比如Copilot,而是在构建一个程序员。我们最近投资了一个AI结构工程师项目。虽然这听起来可能有些奇怪,但想想看:传统上,一个建筑结构设计可能需要两个月才能完成一个版本。而AI结构工程师可能在5小时内就能提供五个版本,大大缩短了建设项目的时间。这个看似小众的市场可能价值数十亿美元。
Sam Lessin:但我想进一步探讨一下。我同意任何可以被系统化描述的专业知识都可以被AI实现,而且会更快更好。但问题是,这真的能成为一个有竞争力的商业模式吗?还是说它最终会成为一种人人都能访问的商品,改变我们的工作方式,但并不是一个好的商业机会?
Vinod Khosla:我的观点是,所有这些应用都会依赖于针对特定领域优化的大型语言模型。每个专业领域的工作流程都是不同的。认为一个通用模型可以做所有事情的想法是不正确的。每个领域都有其特殊性,比如使用哪些特定的库或目录来决定可用的材料和价格,如何组成一个更经济的结构等。这些细节在各个领域都会有所不同。举个例子,AI肿瘤学家不会仅仅依靠GPT-6就能成为专家。它需要掌握许多细节,比如知道有哪些测试可以判断20种不同化疗药物中哪一种对特定癌症最有效。目前这种广泛的测试不常做,因为成本太高,而且大多数肿瘤学家没有如此广泛的知识。但AI可以改变这一点,为患者提供更精准的治疗方案。
Sam Lessin:我明白了,但问题是,界限在哪里?显然会有一些界限,但如果极端情况下,比如说普通家庭医生可能不会是一个好的市场,因为概括一个家庭医生所知道的所有内容并处理它相对容易。虽然你可能会有一个数字家庭医生,但这可能是一个很难盈利的市场。专科医生可能会有所不同。
Vinod Khosla:我不完全同意。我认为,这些专业知识最终会被整合到更广泛的领域中,比如初级保健和心理健康治疗。这两个领域我认为可能会是更大的市场,因为除了知识之外,还涉及其他方面。相比之下,在肿瘤学领域,除了专业知识外几乎没有其他因素。
Jessica Lessin:Dave,你对此有何看法?我知道你一直在密切关注这个领域的创业公司。我也想听听你对Apple的看法。你是第一个在这个播客中提到关注Apple如何通过集成芯片与小型语言模型进行操作的人。我感觉我们在Apple Mail等应用中看到的许多嵌入功能都在你的预测中。
Dave Morin:是的,正如你们所知,我一直认为Apple将是把小型模型带入市场,并使其对消费者和开发者产生实际影响的公司。我最近一直在思考的一个重点是,Apple实际上展示了他们在技术构建、平台构建和产品构建这三个方面的卓越能力。大多数大型科技公司通常只能做到其中的一项或两项。所以我认为Apple真正将其全面的技术实力运用到这一领域是非常令人印象深刻的。
他们不仅仅是在谈论技术,这是我们过去一年看到很多公司在做的。他们也不仅仅是通过为消费者带来优秀产品来实现这一目标,尽管他们确实做到了这一点。我认为最令人印象深刻的是他们昨天推出的大量开发者工具和平台。这里有很多深奥的内容,但我认为开发者和企业家们会非常兴奋能够获得这些新工具。这些工具不仅对Vinod所说的垂直行业有直接影响,同时也为创造伟大的新产品提供了大量新的可能性。
然而,让我感到有些失望的一点是,你不能直接访问这些本地模型,这是很多人没有提到的。他们在开发者方面设置了相当严格的限制。你可以使用他们的Swift编程语言和一系列UI组件,将这些模型应用到你的应用程序中。但作为开发者,目前还不能直接访问模型。我认为这是昨天公告中一个非常有趣但未被广泛报道的细节。除此之外,这些是我的初步想法。
硅谷顶流的AI投资思路
Sam Lessin:从我的角度来看,在种子投资的极端情况下,我认为大多数进入AI领域的种子投资者是在做愚蠢的事情,因为在这个领域,一两百万美元真的不能在价值创造上起到很大作用,这个游戏的规则就是如此。所以,对我来说,这显然是大公司胜出的领域。中间地带可能还有争议,我很想听听你的看法。你显然和我有不同的观点。而在种子阶段,从风险投资的角度来看,这是一场灾难。我很好奇你是否认为我错了,我很想听听你的看法。
Vinod Khosla:让我给你一些具体的例子。2023年1月或2月,有一家公司带着一套看似荒谬的说法来找我。我说,好吧,我给你200万美元的种子资金,如果你能证明这一点,我们可以谈更多的投资。他们在今年3月回来并展示了承诺的结果。我说,不用再找其他投资者了,我明天就给你写1500万美元的支票,我们确实这样做了。我们没有等待外部定价,也没有等待其他人的意见。我不在乎其他人的看法。我们赌了一把。这就是小种子投资如何变成大投资的过程。
顺便说一句,我们还有很多机器人领域的种子投资。真正的小额投资,它们会成长。以Hartwell为例,就是我之前提到的结构工程师的项目,它是一个种子投资。它可能永远不会需要5000万或1亿美元。它将从种子投资成长为一个盈利的业务。所以我确实认为种子投资有空间,但盲目跟随他人的策略是糟糕的。每次有人从DeepMind离职创业,就给他们200万美元,这是一个糟糕的策略。
Sam Lessin:我实际上很好奇,在你的种子轮投资实践中,你如何看待定价原则?因为在我看来,种子阶段在AI中如此糟糕的一个原因是,因为在我看来,AI领域的种子阶段投资如此糟糕的一个原因是,那些从DeepMind出来的人,他们的种子轮不仅可能会失败,而且价格会高得离谱,投资者很难从中赚钱。从投资者的思维角度来看,你如何在AI领域的种子轮投资中找到定价合理的优质项目?
Vinod Khosla:我认为必须花费大量时间思考,首先,哪些领域会被大模型所颠覆,哪些会成为这些模型中的一个功能而变得过时。我们在这方面进行了大量讨论。我们在这些领域有许多内部技术专家和良好的人脉。但我估计,我们80%的种子投资是在2500万美元估值以下。偶尔,我们会像对待Devin那样,尽管没有收入,但我们会根据我们的某些信念系统下注。80%到90%的十亿美元估值的项目,甚至更多,我们会放弃,但有10%到20%我们会投资。我们确实投资了Replit,也投资了Devin。我们偶尔会关注高估值的投资,有时我们会为了维护关系而进行少量象征性投资。
Sam Lessin:关于高估值的投资,你是作为投资者进行的,还是从生态系统的角度进行的?
Vinod Khosla:Devin和Replit绝对是投资。我们还做了一些生态系统和关系投资。我们非常了解某些人,估值失控了,我们会进行象征性投资,这没问题。我们也做了相当多的这种投资。
AI经济的通缩效应
Jessica Lessin:你认为迄今为止这些模型在构建自身方面的行为是否合法?其次,不仅对于内容所有者,还有你提到的医生和专业知识,对于那些专业知识、知识产权和教育以及许多其他领域的创造者来说,在AI世界里他们的商业模式会是什么样的?
Vinod Khosla:今天早上我和《华尔街日报》做了一期播客,整个讨论话题是,AI会带来巨大的通货紧缩吗?我说过,当然会。它将在我们讨论的许多方面带来巨大的通缩,因为许多东西的成本将接近于零,这些东西中的劳动力含量已经消失了。也许还剩下一点土地租金和资本支出,但这将是一个巨大的通货紧缩经济。如果你减少到仅剩20万名医生,80%的医生消失,那么你谈论的是在医疗保健上少花费2500亿美元,这是通货紧缩。所以,如果大部分内容是AI生成的,大部分音乐是AI生成的,这都是通货紧缩的。尽管在许多这些领域,消费将大幅增加,但很难预测这种模式会做什么。我认为我们很难预测这些方面的发展方向。
Jessica Lessin:所以内容行业要小心了。
Sam Lessin:有一个我一直在思考的问题,与其付费给所有这些所谓的版权所有者,为什么不雇佣比如说1万个聪明人整天和AI交谈呢?似乎更有效率,甚至只需要1000人,雇佣1000个聪明人并说,我不会从任何人那里获得许可,我只是基本上每天付给1000人全职工资,让他们只谈论那个,就是元数据。
Dave Morin:这不就是meta和YouTube的模式吗?用户免费提供内容。
Sam Lessin:meta的内容生成模式一直很有趣。我确实相信这些问题的答案是这些东西是其界面的反映,媒介即信息。我在想,如果有一千人每天花6小时与大语言模型对话,讨论他们学到的东西,会怎样?这几乎像是一种现代神谕。
Vinod Khosla:Sam,在这个可能出现通缩的AI经济中,我们需要重新思考什么是有价值的。我不认为Taylor Swift仅仅是关于音乐,这是一种文化现象,一种年轻人的体验。
所以我确实认为人类体验的本质会对事物的价值进行重新评估。为什么我们从真正制造精良的商品转向支付三倍的价格购买手工制作且不太精致的商品?因为这是我们重视的人类体验,不同的人重视不同的东西。所以这一切如何重组成一套价值体系,很难预测。我想说的是,我们唯一能说的是它会发生巨大的变化。我认为我们无法说出它将如何改变。