簡單匹配係數
簡單匹配係數(英語:simple matching coefficient,縮寫SMC),又稱為蘭德相似係數(Rand similarity coefficient),是用於比較樣本信合之間相似性與多樣性的統計量。[1]
A | |||
---|---|---|---|
0 | 1 | ||
B | 0 | ||
1 |
假設兩個對象A與B分別有n個二值屬性,則SMC的定義為:
其中
- 表示A與B的數值都為1的屬性數量;
- 表示A的數值為0、而B的數值為1的屬性數量;
- 表示A的數值為1、而B的數值為0的屬性數量;
- 表示A與B的數值都為0的屬性數量。
類似地,可以定義簡單匹配距離(simple matching distance,縮寫SMD)為,用於量度樣本集合間的不相似度。[2]
SMC與漢明相似度間呈線性關係:。而其與歐基里得距離間的關係為,其中n為屬性總數。SMC與雅卡爾指數也很相似,區別在於在雅卡爾指數的定義中分子與分母都沒有項。