簡單匹配係數

簡單匹配係數(英語:simple matching coefficient,縮寫SMC),又稱為蘭德相似係數Rand similarity coefficient),是用於比較樣本信合之間相似性與多樣性統計量[1]

A
0 1
B 0
1

假設兩個對象A與B分別有n個二值屬性,則SMC的定義為:

其中

表示AB的數值都為1的屬性數量;
表示A的數值為0、而B的數值為1的屬性數量;
表示A的數值為1、而B的數值為0的屬性數量;
表示AB的數值都為0的屬性數量。

類似地,可以定義簡單匹配距離simple matching distance,縮寫SMD)為,用於量度樣本集合間的不相似度。[2]

SMC與漢明相似度間呈線性關係:。而其與歐基里得距離間的關係為,其中n為屬性總數。SMC與雅卡爾指數也很相似,區別在於在雅卡爾指數的定義中分子與分母都沒有項。

參考文獻

  1. ^ 存档副本. [2018-09-14]. (原始內容存檔於2017-12-24). 
  2. ^ 存档副本. [2018-09-14]. (原始內容存檔於2018-07-27).