User:AurusHuang/淑女品茶

实验询问,当准备一杯茶时,品酒师能否分辨出是否在冲泡茶之前添加了牛奶
罗纳德·费舍尔(Ronald Fisher),1913年

统计实验设计中淑女品茶罗纳德·费舍尔Ronald Fisher)设计的随机实验,并在他的《实验设计》The Design of Experiments ,1935)一书中进行了报道。 [1]该实验是费舍尔虚无假设概念的原始阐述,也就是“在实验过程中从未得到证明或建立,但有可能被反驳”的假设。 [1] [2]

受试者是费舍尔的同事,也是一位藻类学家缪丽·布里斯托尔英语Muriel Bristol,她声称能够辨别冲茶时先放的是茶还是牛奶。费舍尔建议随机给她8杯茶,4杯先放茶,4杯先放牛奶,然后便可知道她碰巧猜对了特定杯数的可能性。

费舍尔的描述只有不到10页,以其在术语,计算和实验设计方面的简单性和完整性而著称。 [3]该示例大致基于Fisher生活中的一个事件。使用的测试是费舍尔的精确测试。

实验中,受试者面前有8杯茶,除了其中4杯是先放牛奶,其余4杯是先放茶外,并无区别。受试者在知道这一前提之下,必须判断出哪4杯先放了牛奶,哪4杯先放了茶。受试者清楚了解这个实验的方法,且允许直接比较每一杯茶。

零假设是受试者没有分辨茶的能力。在费舍尔的方法中,没有备择假设[1]

该测试只需统计测试者选择的4个杯子中猜对的数量。使用组合公式,总共有 个杯子,受试者需要选择个杯子,则总的可能性有

种。

品茶测试的分布
成功次数 选择组合 组合数
0 oooo 1 × 1 = 1
1 ooox, ooxo, oxoo, xooo 4 × 4 = 16
2 ooxx, oxox, oxxo, xoxo, xxoo, xoox 6 × 6 = 36
3 oxxx, xxxx, xxox, xxxo 4 × 4 = 16
4 xxxx 1 × 1 = 1
合计 70

该表最后一列中给出的可能成立次数的频率推导如下:假设受试者认为自己选的4杯里都是先放奶。若她四杯全部猜中,或者四杯都猜不中,都只有一种组合;若只猜中一杯,则相当于从8杯茶中选出1杯先放奶及3杯先放茶,各有种组合,故总共有4×4=16种组合。猜中三杯同样亦有16种组合。相应地,猜中两杯共有36种组合。因此成功的数量是根据超几何分布分布的。

如果要拒绝零假设,则受试者必须全部猜对。这是因为,假如受试者并无能力分辨茶,却全部猜对,这样的结果发生的概率只有1/70(≈ 1.4%,小于显著性检验的标准5%),而4杯中至少猜对3杯的概率为(16 + 1)/ 70(≈ 24.3%> 5%)。


根据David Salsburg的说法,费舍尔的同事H. Fairfield Smith透露,缪丽成功地正确识别了所有八个杯子。[4][5]

参考文献

  1. ^ 1.0 1.1 1.2 Fisher 1971.
  2. ^ OED quote: 1935 R. A. Fisher, The Design of Experiments ii. 19, "We may speak of this hypothesis as the 'null hypothesis' [...] the null hypothesis is never proved or established, but is possibly disproved, in the course of experimentation."
  3. ^ Fisher, Sir Ronald A. https://books.google.com/?id=oKZwtLQTmNAC&pg=PA1512&dq=%22mathematics+of+a+lady+tasting+tea%22 |chapterurl=缺少标题 (帮助). James Roy Newman (编). The World of Mathematics, volume 3. Courier Dover Publications. 1956 [The Design of Experiments (1935)]. ISBN 978-0-486-41151-4. 
  4. ^ Salsburg (2002)
  5. ^ Box, Joan Fisher. R.A. Fisher, The Life of a Scientist. New York: Wiley. 1978: 134. ISBN 0-471-09300-9.