近日,一项由斯坦福大学、华盛顿大学和Google DeepMind联合进行的研究取得重大突破,成功开发出1000个AI智能体,用于预测人类行为,准确率最高可达85%。这些AI智能体(AI Agent)能在社会实验中逼真地模拟人类行为,为经济学、社会学、组织学和科学等领域的研究提供了新的工具。
研究团队对1000多名具有代表性的美国人进行了深入访谈,这些访谈覆盖了不同年龄、性别和教育背景。基于这些访谈数据,研究人员建立了AI智能体模型。该系统将详细的访谈记录与GPT-4o模型相结合。当用户向智能体提问时,系统会加载访谈记录,使AI能够模仿受访者的回答。
在多项测试中,基于访谈数据的AI智能体在预测《通用社会调查》等问题时,准确率高达85%,远超仅依赖人口统计信息的AI智能体。在五项社会科学实验中,AI智能体的表现与人类高度一致,相关系数达到0.98,显示出AI对人类行为强大的模拟能力。
与传统的人口统计法相比,访谈驱动的AI在处理不同种族群体和观点的预测方面更为准确,有效减少了人口统计类别之间的偏差。
研究团队已将包含1000个AI模型的数据集开放至GitHub,同时建立了两层访问机制,确保综合性数据对研究人员完全开放,而个别参与者的详细数据则需经过特殊审批。