归纳与统计:范式和问题

  • 应当让科学家认清的事情就是,彻底弄清楚你所要研究的问题,然后选择一个适当的统计范式

    • 统计学的作用在于,当研究目标确定后,可以想办法设计出有效的实验,以便收集数据,而且通过强有力的公式化的推理过程,分析这些数据
    • 而最原始的和最根本的实质性工作,如何提出有意义有意思的问题,仍然是科学家自己的职责。
  • 贝叶斯范式和频率论者范式都具有极端的客观性,都包括三个主要的组成部分:假说、数据和推理过程。两者的不同主要在于提出问题的方式和所提出的问题不同。

  • 贝叶斯模式的问题是:

    • 给定数据和任何的先验知识,一个假说为真的概率是什么?
  • 频率论者模式的问题是:

    • 依据不拒绝真实的假说,以及不接受虚假的假说的原则,判定一个推理过程的可靠性是多少。
    • 基本的思想就是:一个错误率低的可靠过程就是一件适合的工具。
  • 贝叶斯范式的重点放在假说上,而频率论者的重点放在过程上。

  • 由于两者所提出的问题不同,引出了一系列进一步的差别:

    • 先验的数据和要求的数据
    • 概率的概念
      • 贝:概率是给定个人知识的前提下,个人对命题(或假说)的信任程度;
      • 频:概率是在长时间运行一个事件(或实验)出现的频率,这种过程需要大量多次的重复,这种重复可能是实际发生的或者也可以是想象的。
    • 美学因素
    • 或然原理与设想的数据
  • 特定例子:

    • 一个简单的临床试验:
      • 两上接受试验者随意安排,一个用A药品治疗,一个用B,所要测的反应是哪一个受试者存活的久一些。
      • 数据:对于10对接受试验者而言,药品A赢8次,药品B赢2次
      • 问题:这是不是可以做为实际的证据,说明药品A优于药品B,或者,按照更多定量的项目,药品A优越性的概率是多少?
    • 按照贝叶斯范式,需要提出和回答的问题是这样的:
      • 给定数据,处置方案A优于处置方案B的概率是多少?
      • 某些特定的处置方案对一位新患者治疗效果最好的概率是多少?
    • 按照频率论者范式,需要提出和回答的问题是这样的:
      • 给定一个假设的零位假说,该假说假定各种处理方案没有差别,假定该假说为真,一个结果达到观察数据的极限,或者比观察到的数据更为极端,这样的概率是多少?
  • 从哲学上讲,两种范式的差别不过是从数据到模型的归纳推理,与从模型到数据的演绎推理之间的差别。