1月15日,OpenAI最新推理AI模型o1在推理过程中会突然使用中文、波斯语或其他语言进行思考。例如,在回答“strawberry”这个单词中有多少个“r”的问题时,o1可能会在推理过程中使用其他语言,但最终仍以英语给出答案。
针对这一现象,专家们提出了几种可能的解释。Hugging Face首席执行官认为,o1模型的训练数据集中包含大量中文,这可能导致其在推理过程中使用中文。此外,Google DeepMind研究员表示,OpenAI等公司可能使用了第三方的中文数据标注服务,使得o1在推理时受到中文语言的影响。
还有专家表示,o1模型可能在尝试使用它认为最高效的语言来解决“幻觉”等问题。阿尔伯塔大学AI研究员指出,模型并不了解语言之间的差异,对所有文本一视同仁,使用token(词、音节或单个字符)进行处理。
截至目前,OpenAI尚未对o1模型的多语言“思考”现象作出解释,也没有正式承认这一现象。AI专家对此也没有给出明确答案,但他们的猜测为我们提供了一些可能的解释。