归纳与统计:贝叶斯决策

  • 推理与决策的关系:[P 190]

    • 推理追求的是真信念;
    • 决策追求的是恰当和适宜的行动
    • 信念为决策提供信息,并且影响到所采取的行动,使决策问题构成了推理的一个从属问题。
  • 形式化的正规决策:[P 190]

    • 提供一个逻辑框架,将每一条推理都明确地表达出来,将复杂的问题分解成易于处理和控制的若干部分,以消除个人推理中不协调不连贯不一致的地方。
    • 将各种意见和见解条理化明晰化,加速与决策有关的其他人员清晰地交流,并且促成有序的和创造性的解决方案。
  • 形式化的正规决策,是对非形式化的普通决策的一种补充,而非替代。[P 190]

  • 决策理论的两个维度及本节重点:[P 190]

    • 两个维度:
      • 规范部分
      • 描述部分
    • 本节重点:
      • 是规范理论,为了更好的决策,也得出某些描述性的结论和指导性的意见
  • 决策的基本结构:[P 190]

    • 决策理论把一种状况的组成部分(组件)或原因划分为两种基本上不同的类别
      • 所依据的准则就是:我们是否有能力控制这个给定的组件或原因。
      • 能够控制的,称之为:“行动”或选择;不可能加以控制的,称之为:“状态”。
      • 每一个状态与行动的结合,就称之为“结果”
      • 每一个结果被指派为一个“用途”或者“后果”用以评估该结果的价值、利益或好处。
  • 一个简单的例子:[P 191]

    • 上图表示了一个简单的例子,关于一个农民作物种植的决策。
      • 有三种可能的自然状态,它们超出农民的控制能力之外:良好、不错或糟糕的天气。
      • 还有三种农民可能采取的行动:种植作物A、种植作物B,或者将土地出租。
    • 从左下部分开始把关于天气的旧数据和新数据,按照先验的和可能出现(或然)的加以概括。
      • 例如,根据广泛的历史气象纪录,长期频繁出现的情况,概括为先验概率,用0.3、0.5和0.2分别表示出良好、不错或糟糕的天气。
      • 根据近期的长期天气预报,概括出或然率的数值:以0.6、0.3、和0.1分别表示出良好、不错或糟糕的天气。
    • 然后根据贝叶推理,结合先验数值和或然率数值计算出天气状况的后验概率,表示在图表中部。
      • 将每一个先验值乘以相应的或然率,得出:0.18、0.15和0.02,总计为0.35
      • 将三个数值分别除以总计值,得出后验概率,分别近似为:0.51、0.443和0.06,分别代表良好、不错或糟糕的天气。
    • 图的左上部分,表示的是效果或效用矩阵。
      • 任何一个给定的生长季节的结果都以特定的状态-组合加以表示
      • 三个可能的状态是:良好,不错,糟糕
      • 三个可能的行动是:作物A、作物B、出租
      • 总体来说共有3 X 3=9种可能的结果
      • 效果矩阵显示出每个种可能结果的效用或价值,正数表示盈余,负数表示亏损
    • 图的右上部分,规定了一个决策准则(判据):使预期的效益最大化。
      • 这个预期的效益是一个平均值,是一个预测性的效益值
      • 对每一种可能的行动都逐个计算,把每一个状态下的效用乘以相应状态下的概率,然后求和。
      • 例如种植作物A的预期效益值为:(100 X 0.51) + (10 X 0.43) + (-20 X 0.06) ≈ 54.1
      • 通过类似运算,种植作物B的预期效益值为58.0,出租的为30.0
      • 这三个数值中最大的就是58,表明种植作物B是最好的决策。
    • 这个例子说明了决策问题中频繁出现的一个特点:
      • 由于误差或错误数值的不同,会造成不同的惩罚和损失,使得出的最好的决策不一定是看起来最好的项目。
  • 期望值公理[P 192]

    • 符号约定:
      • Prob:概率
      • des:期望值或效益值
    • 公理内容:
      • 如果prob(X ∧ Y)=0,并且prob(X ∨ Y)≠0
      • 则:des(X V Y) = (dexX x probX + desY x probY) / (probX + probY)
    • 说明:
      • 这个公理把概率和期望值联系到一起,具体来说,就是把状态的概率与结果的效益值联系到一起。
      • 它的意思是:一个行动的效益值等于各个效益值的平均值,每一项效益值是各个不同结果乘以它们各自的概率。即:按照不同的加权值估价不同的单项效益。(预设前提:效益值必须相斥且穷尽)
  • 决策例子中的几个要点:[P 193]

    • 因为不确切的知识,或者不可靠的预见性,在决策过程中的定量,利用分布能够更好的予以模型化,比单纯的数值更好。
    • 由于对风险采取了不同的态度,决策的准则(判据)并不一定选择预期效益的最大化。
    • 进行决策,可能要对几项准则或判据同时加以考虑并予以优化。
    • 可能需要由一群人作出决策
  • 决策的十种危险错误[P 194]

    • 匆匆忙忙收集信息后,没有认真地条理化,没有时行必要的处理,就急于作出决策;
    • 以错误的方式解决问题,忽略了最好的意见和重要的目标;
    • 仅仅以一种方式定义问题,限制了其他可能的解决方案;
    • 由于过分盲目地相信有理由的假设和某此众人以为是权威的意见,而放弃收集事实的工作环节;
    • 过分依靠现成的可以的信息和最简单的信息;
    • 头脑发热,感情冲动、心血来潮、不假思索、挥舞权柄、目无他人、随意拍板、脱口而出,不履行严格的系统化决策程序;
    • 习惯性的相信一帮所谓精英或能人,以为这样就能自然而然地生成良好的群体决策;
    • 没有认真地从过去的决策和后果中汲取反馈教训;
    • 没有保存系统的记录,无法追踪和查找过去决策的具体情况和经验教训;
    • 没有很好的审查、监督和改进决策程序,过去习惯性的错误继续发生。
    • 此外还有一个问题,人们往往忽略了发挥逻辑的潜力,利用逻辑改进和完善一项决策;往往把等待解决的问题孤立起来,形成僵化的模式。