田岛D检验

田岛D检验(英語:Tajima's D test)是日本学者田岛文生于1989年提出的一种统计检验方法,用于检验DNA序列在演化过程中是否遵循中性演化模型。[1]

科学原理

在选择中性模型下,对于一个处于突变-漂变平衡且大小稳定的群体,群体参数「 」可以通过计算两两核苷酸差异的平均值「 」和分离核苷酸位点数量「 」两种方法来估算,且二者相等。因此:

对于双倍体DNA:

 

对于单倍体DNA:

 

在公式中,“ ”表示分离位点的数量,“ ”表示样本数,“ ”表示有效群體大小,“ ”则表示基因突变率。

在存在自然选择或其他破坏中性模型的因素存在时,「 」与「 」的期望值会发生变化,且不再相等。通过这两者估测的「 」值「 」与「 」之间的差异d,即田岛D检验的统计基础,统计量  与其标准差 之商,即:

 

田岛文生用计算机模拟证明,统计量 符合貝塔分布(Beta distribution)。对某一样本,若 值处于置信区间之外,则可以拒绝零假设,即否定选择中性。

检验结果阐释

田岛D值 数学依据 生物学解释1 生物学解释2
D=0  等于 (观测值=期望值):平均两两核苷酸差异等于分离位点数 差异性的观测值符合期望值 群体演化处于突变-漂变均衡,无自然选择的印记
D<0且结果显著  小于 (观测值<期望值):平均两两核苷酸差异小于分离位点数 罕见等位基因过量(罕见等位基因过剩) 近期的选择扫荡或近期瓶颈效应之后的群体扩张
D>0且结果显著  大于 (观测值>期望值):平均两两核苷酸差异大于分离位点数 罕见等位基因不足(罕见等位基因过少) 平衡选择或群体紧缩

参考文献