小米阅读 > 其他 > 师生心理学江湖：对话手册 > 第180章课·一次游戏vs多次游戏：博弈论中的“远见”法则—课堂对话

师生心理学江湖：对话手册第180章课·一次游戏vs多次游戏：博弈论中的“远见”法则—课堂对话

作者：北斗联星分类：其他更新时间：2025-11-15 04:03:23

今天的课堂，和蔼教授将带领叶寒、秦易、许黑、蒋尘、周游五位同学，以博弈论为核心，拆解“一次游戏”与“多次游戏”的不同玩法。我们会从考试作弊的收益计算切入，结合商业监管、体育赛事的真实案例，穿插心理学的“即时满足偏差”、哲学的“功利主义与义务论”，最终理解：人生是场“无限游戏”，所谓“远见”，就是不用一次游戏的策略应对多次挑战，不用有限规则套无限未来。

上课铃刚落，教授手里拿着一张模拟试卷走进教室，笑着问：“同学们，有没有人曾想过‘就作弊这一次，应该不会被发现’？或者觉得‘偶尔钻次规则空子，没什么大不了’？”

秦易有点不好意思地举手：“教授，我初中时一次数学测验没复习好，就偷偷看了同桌的选择题，当时觉得‘就一次，分数上去就行’，后来没被发现，还庆幸了好久。”

许黑也点头：“我身边有人打游戏时用外挂，说‘就爽这一局’，结果后来被封号了，之前攒的装备全没了。”

教授点点头：“这就是我们今天要聊的核心——一次游戏和多次游戏，玩法天差地别。很多人栽跟头，就是把‘多次游戏’当成了‘一次游戏’来应对。我们先从博弈论的基础说起，博弈论分两类：零和游戏（比如下棋，你赢我输）和非零和游戏（比如合作做生意，可能双赢、双输，也可能一赢一输）。大家常说‘追求双赢’，但非零和游戏里，有个很有意思的现象：‘双输’反而最容易稳定，这就是纳什均衡。而要实现双赢，不仅要理性，更要‘敢信对方不耍赖’——但生活里的博弈，大多不是‘一锤子买卖’，而是反复进行的‘多次游戏’，这时候策略就得变了。”

“我们先算笔账，就用考试作弊的例子。”教授在黑板上写下假设条件，“假设全班只有张三作弊，被发现概率5%。没被发现，他多拿10分（收益 10）；被发现，得0分（损失-100）。大家算算，一次考试里，张三作弊的‘收益期望’是多少？”

蒋尘拿起笔飞快计算：“10乘以95%，减去100乘以5%……10x0.95=9.5，100x0.05=5，所以9.5-5=4.5？那他作弊好像赚了？”

“没错，一次游戏里，期望收益是正的4.5，看起来‘合算’。”教授话锋一转，“但如果考试不是一次，而是k次呢？比如10次、20次、30次，而且只要有一次被发现，之前所有分数清零，损失是100k。大家再算10次考试的情况：全部作弊成功的概率是95%的10次方，大概60%；收益是10x10=100，损失是100x10=1000。期望收益就是0.6x100 - (1-0.6)x1000=60-400=-340？不对，教授，我是不是算错了？”

教授笑着纠正：“公式应该是‘成功时的收益x成功概率 - 失败时的损失x失败概率’，也就是0.95^kx10k - (1-0.95^k)x100。当k=10时，0.95^10≈0.6，所以0.6x100 - 0.4x100=60-40=20，这时候期望还是正的。但k=20时，0.95^20≈0.36，0.36x200 - 0.64x100=72-64=8，快接近零了；k=30时，0.95^30≈0.21，0.21x300 - 0.79x100=63-79=-16，这时候就亏了；k=100时，0.95^100≈0.0059，0.0059x1000 - 0.9941x100≈5.9-99.41=-93.51，几乎肯定亏。”

叶寒皱眉：“可现实里，有人会想‘我就作弊一次，以后再也不做’，这样不就只承担一次风险吗？”

“这就涉及到心理学里的‘即时满足偏差’和‘行为强化效应’。”教授解释道，“人天生更看重‘眼前的好处’，而忽略‘未来的风险’——一次作弊成功，拿到高分的‘甜头’会强化这个行为，下次遇到没复习好的情况，就会忍不住再试。就像有人第一次闯红灯没被撞，下次就更容易闯红灯；第一次撒谎没被拆穿，下次就更容易撒谎。行为心理学里有个‘操作性条件反射’：得到正反馈的行为，会反复出现。所以‘只作弊一次’的想法，大多是自欺欺人。”

“那怎么才能阻止这种‘侥幸心理’？”周游问，“是不是只能靠加大处罚？”

“加大处罚是关键，但更重要的是‘改变游戏规则’——让‘一次作弊的损失’覆盖‘所有过往收益’。”教授举例子，“英美股市为什么健康？因为一旦发现财务造假，不仅要没收这次的非法所得，还要罚到倾家荡产，甚至追究刑事责任。比如安然公司造假，高管坐牢，投资者获得巨额赔偿，公司直接破产——这种‘一次作弊就清盘’的规则，让大多数人不敢冒险。再看美国的假货少，不是因为美国人道德高，而是一旦造假被发现，要向所有消费者赔偿，比如某品牌奶粉造假，可能要赔几千万美元，一次就倒闭。”

“但体育赛场好像不一样？”叶寒追问，“比如阿姆斯特朗，七届环法冠军，后来被查出用禁药，头衔被撤了，但他之前赚的上千万美元还在，现在资产还有5000万。如果他不用禁药，可能一个冠军都没有，这不就是‘一次作弊的收益大于损失’吗？”

“你说到了点子上——规则不同，玩法就不同。”教授点头，“体育赛场的问题在于‘一次作弊的收益太高，损失太低’。阿姆斯特朗用禁药，得到的是冠军头衔、商业合同、上亿收入；被发现后，只是撤回头衔，损失部分代言，但之前的收入已经落袋。这种‘收益远大于损失’的规则，必然导致作弊屡禁不止。2012年伦敦奥运会女子举重75公斤级，金银铜牌都因禁药被取消，最后第四名拿冠军——这就是规则漏洞导致的‘劣币驱逐良币’。”

“那如果所有人都作弊呢？”蒋尘突然问，“比如一个班里，大家都作弊，每个人都拿满分，这不是‘双赢’吗？”

教授反问：“真的是双赢吗？如果这个班的学生永远不走出校门，可能看起来没问题，但人总要进入社会。社会里的‘考试’，没有考官和分数，只有行为和后果——比如一个作弊拿到高分的医学生，到了医院不会做手术；一个作弊拿到证书的工程师，设计的桥梁会塌。人生是场‘无限游戏’，校园里的作弊，只是‘预演’，真正的代价在后面。”

“这就像中国古代的科举，为什么能运转上千年？”教授继续说，“科举也有作弊，但处罚极重——一旦发现科场舞弊，不仅考生被流放，考官也要掉脑袋。所以作弊是少数，不影响整体公平。今天的高考也是如此，作弊被发现，不仅取消成绩，还会记入诚信档案，影响未来升学就业——这种‘一次作弊影响终身’的规则，让大多数人不敢碰红线。一个系统能长期运转，核心是‘规则能防止自毁’：如果全员作弊，系统输出的都是‘不合格产品’，最终会被淘汰。”

“我们再延伸到‘无限游戏’——比‘多次游戏’更长久的，是‘希望游戏一直玩下去’。”教授举NbA的例子，“NbA为什么能成为最成功的体育联赛之一？因为它有两个关键规则：第一，选秀时战绩差的球队先选新秀，比如上赛季垫底的球队，能优先选潜力新人；第二，设置工资帽，防止有钱的球队签下所有巨星。这两个规则，就是为了避免‘马太效应’——强者越强，弱者越弱。如果某支球队永远赢，观众会看腻，联赛会没人关注；只有各队实力平衡，才有悬念，游戏才能一直玩下去。”

“这背后是哲学里的‘可持续发展思维’——无限游戏的目标不是‘赢一次’，而是‘让游戏持续’。”教授总结，“比如商业合作，不是‘赚一次快钱’，而是‘长期共赢’；比如人际关系，不是‘利用一次’，而是‘长久信任’。很多人理解错博弈，就是把‘人生这场无限游戏’，当成了‘几次独立的一次游戏’——比如为了眼前的利益，欺骗客户、背叛朋友，看似赢了一次，却输掉了未来所有可能的合作。”

“那什么是‘远见’？”秦易问。

“远见，就是在一次游戏里，想到多次的后果；在有限游戏里，看到无限的可能。”教授说，“比如有人找工作，只看‘第一个月工资多少’，不看‘未来有没有成长空间’——这就是用一次游戏的策略（短期收益）应对多次游戏（职业发展）；有人做项目，只想着‘这次能赚多少钱’，不考虑‘会不会伤害品牌口碑’——这就是用有限游戏的规则（单次项目）套无限游戏（品牌长期发展）。”

课堂接近尾声，教授抛出思考题：“假设你们是学校的教务老师，要设计一套‘减少考试作弊’的方案，除了‘加大处罚力度’，还能从‘多次游戏’和‘无限游戏’的逻辑出发，增加哪些规则？比如如何让‘不作弊的长期收益’大于‘作弊的短期好处’？”

“大家可以课后分组讨论，下次上课分享方案。觉得今天的博弈论分析有启发的同学，别忘了点赞支持——很多生活里的选择，比如‘要不要熬夜赶工’‘要不要拖延作业’，其实都能用‘一次vs多次游戏’的逻辑判断。下次课，我们会聊‘博弈论在人际交往中的应用’——比如为什么‘真诚待人’是长期最优策略，不见不散！”

“一次游戏vs多次游戏”课堂总结:

该课堂由和蔼教授带领叶寒、秦易等五位同学，以博弈论为核心，结合心理学、哲学原理与现实案例，拆解“一次游戏”与“多次游戏（含无限游戏）”的不同玩法，最终指向“远见”的本质。

课堂开篇，教授先明确博弈论分类（零和游戏、非零和游戏），指出非零和游戏中“双输”易成纳什均衡，而生活中博弈多为“多次游戏”，策略需区别于“一次游戏”。随后以考试作弊为例计算收益：一次考试中，作弊被发现概率5%时，收益期望为4.5，看似“合算”；但多次考试下，随次数k增加，全部作弊成功概率骤降（k=30时仅21%），收益期望转为负数（k=30时约-16），且现实中作弊成功的“即时满足”会通过“操作性条件反射”强化行为，“只作弊一次”多为自欺欺人。

教授进一步用正反案例对比规则的影响：英美股市、美国打假靠“一次作弊清盘”（没收所得倾家荡产）遏制违规；而体育赛场因“作弊收益＞损失”（如阿姆斯特朗保留千万收入），禁药问题频发。同时提及科举、高考因“重罚舞弊”（科举考官连坐、高考记诚信档案），保障系统长期运转，避免“全员作弊致系统自毁”。

针对“无限游戏”，教授以NbA为例，其“弱队先选秀”“工资帽”规则，规避“马太效应”，保障赛事悬念，体现“无限游戏目标是让游戏持续”的哲学思维。最后总结：“远见”即不用一次游戏策略应对多次挑战，不用有限规则套无限未来；并抛出思考题——作为教务老师，除重罚外，如何从“多次\/无限游戏”逻辑设计减作弊方案。

设置

手机

书页

换源

听书

师生心理学江湖：对话手册 第180章 课·一次游戏vs多次游戏：博弈论中的“远见”法则—课堂对话

师生心理学江湖：对话手册第180章课·一次游戏vs多次游戏：博弈论中的“远见”法则—课堂对话