田島D檢驗

田島D檢驗(英語:Tajima's D test)是日本學者田島文生於1989年提出的一種統計檢驗方法,用於檢驗DNA序列在演化過程中是否遵循中性演化模型。[1]

科學原理

在選擇中性模型下,對於一個處於突變-漂變平衡且大小穩定的群體,群體參數「 」可以通過計算兩兩核苷酸差異的平均值「 」和分離核苷酸位點數量「 」兩種方法來估算,且二者相等。因此:

對於雙倍體DNA:

 

對於單倍體DNA:

 

在公式中,「 」表示分離位點的數量,「 」表示樣本數,「 」表示有效群體大小,「 」則表示基因突變率。

在存在自然選擇或其他破壞中性模型的因素存在時,「 」與「 」的期望值會發生變化,且不再相等。通過這兩者估測的「 」值「 」與「 」之間的差異d,即田島D檢驗的統計基礎,統計量  與其標準差 之商,即:

 

田島文生用計算機模擬證明,統計量 符合貝塔分佈(Beta distribution)。對某一樣本,若 值處於置信區間之外,則可以拒絕零假設,即否定選擇中性。

檢驗結果闡釋

田島D值 數學依據 生物學解釋1 生物學解釋2
D=0  等於 (觀測值=期望值):平均兩兩核苷酸差異等於分離位點數 差異性的觀測值符合期望值 群體演化處於突變-漂變均衡,無自然選擇的印記
D<0且結果顯著  小於 (觀測值<期望值):平均兩兩核苷酸差異小於分離位點數 罕見等位基因過量(罕見等位基因過剩) 近期的選擇掃蕩或近期瓶頸效應之後的群體擴張
D>0且結果顯著  大於 (觀測值>期望值):平均兩兩核苷酸差異大於分離位點數 罕見等位基因不足(罕見等位基因過少) 平衡選擇或群體緊縮

參考文獻