eLife 2025年12月1日 利用贝叶斯自适应马尔可夫决策过程探索个体在尾部风险敏感度上的差异 该研究提出一个贝叶斯自适应马尔可夫决策过程框架,发现个体在未知环境中的探索行为受其对尾部风险(极端负面结果)敏感度的差异调控。这一发现对理解人类决策机制及优化人工智能的探索-利用权衡策略具有重要理论指导意义。 原文
该研究提出一个贝叶斯自适应马尔可夫决策过程框架,发现个体在未知环境中的探索行为受其对尾部风险(极端负面结果)敏感度的差异调控。这一发现对理解人类决策机制及优化人工智能的探索-利用权衡策略具有重要理论指导意义。