您现在的位置: 首页- 科学研究- 学术活动

【经工讲堂2026年第5期】香港中文大学陈南教授应邀做学术报告

2026年4月20日上午10:00,北京理工大学经济学院经工讲堂2026年第5期学术报告在中关村校区主楼317会议室举行。香港中文大学系统工程与工程管理学系陈南教授应邀题为Artificial Intelligence or Artificial Stupidity的学术报告。报告由经济学院金融与财政系主任卓小杨老师主持,学院多位教师和硕博研究生参与。

微信图片_20260420181213_661_403.png

陈南教授指出,现代AI定价算法在缺乏显式指令与沟通的情况下,极易通过自主学习形成默契合谋,从而维持超竞争高价。然而,现有算法存在明显局限:单智能体Q-learning无法捕捉智能体间的交互行为;而试图解决多智能体交互的Nash Q-learning则面临纳什均衡计算成本高、需观测对手Q值、不适合去中心化决策且缺乏通用收敛性保证等难题。

针对上述挑战,陈教授提出了一种去中心化的双时间尺度演化博弈方法。该算法的核心机制是:每个智能体建立对对手行动的信念(Beliefs),并采用受扰动的最佳反应规则更新其策略(Policy)。算法设计围绕促成合谋的三个关键要素展开——Q-value function、Beliefs与Policy,即市场参与者基于共同历史数据设定的初始策略,会引导算法走向合谋均衡。研究发现,算法越有耐心(折扣因子高)、越复杂(能利用信念刻画对手行为),越容易达成合谋;而环境中的噪声则会增加理解奖励函数和建立奖惩机制的难度,从而阻碍合谋。

该方法的关键创新在于快慢结合的双时间尺度”——将策略和信念的更新速率设定得比Q值更新慢得多。这一设计避免了每步求解复杂纳什均衡的难题,并有效克服了多智能体强化学习中环境非平稳性的障碍。陈教授进一步结合多时间尺度随机逼近(针对快速时间尺度)与拟费耶尔分析(针对慢速时间尺度),在理论上证明了该算法能局部收敛至近似纳什均衡(ϵ-Nash equilibrium),奠定了坚实的理论基础。

在伯特兰寡头垄断竞争模型的数值实验中,该方法生动展示了AI合谋的形成过程,成功复现了重复博弈中的Grim TriggerWin-Stay-Lose-Shift等多种纳什均衡。若关闭其中一个策略,其余智能体将退化为单智能体Q-learning。此外,陈教授还将上述双时间尺度框架从有限种群推广至无限种群的平均场博弈,验证了该算法在复杂多智能体环境中的高效性与泛化能力。

微信图片_20260422081142_334_253.jpg

在报告的最后部分,陈南教授围绕AI Bubble Game分享了关于AI智能体在资产泡沫中的行为新发现。 该博弈模型基于Monas and Pouget(2013, 2016)的经典设定:N个交易者按随机顺序依次交易一项无内在价值、零收入的资产,交易者不知道自己的顺序位置。陈教授通过引入AI智能体进行实验,得出两项重要结论:

AI参与非理性泡沫:即便存在唯一的无交易均衡,AI智能体仍会生成投机性交易,形成非理性泡沫。提高AI的推理能力(如链式推理chains of thought)虽能减少此类泡沫,但无法完全消除。链式推理分析表明,AI之所以参与非理性泡沫,是因为其对市场的简化认知导致了错误信念的形成。

AI参与理性泡沫:当环境同时允许无交易均衡投机性泡沫均衡存在时,AI智能体能够识别这种多重均衡,并主动协调至投机性均衡,展现出类似人类的泡沫协调行为。

这些发现为理解AI在资产定价中的潜在作用与风险提供了全新视角,也引发了关于AI是否会被用于构造或放大市场泡沫的深刻思考。

陈南教授的报告内容清晰透彻,兼具理论深度与启发性。在交流环节,师生围绕AI博弈论、泡沫形成机制及其应用展开深入热烈的讨论,为后续开展规范、高质量的深度学习AI应用研究奠定了良好基础。