全域唯一識別碼
全域唯一識別碼(英語:Globally Unique Identifier,縮寫:GUID;發音為/ˈɡuːɪd/或/ˈɡwɪd/)是一種由演算法生成的唯一標識,通常表示成32個16進制數字(0-9,A-F)組成的字串,如:{21EC2020-3AEA-1069-A2DD-08002B30309D},它實質上是一個128位元長的二進制整數。GUID一詞有時也專指微軟對UUID標準的實現。
GUID的主要目的是產生完全唯一的數字。在理想情況下,任何電腦和電腦叢集都不會生成兩個相同的GUID。GUID的總數也足夠大,達到了2128(3.4×1038)個,所以隨機生成兩個相同GUID的可能性是非常小的,但並不為0。所以,用於生成GUID的演算法通常都加入了非隨機的參數(如時間),以保證這種重複的情況不會發生。(見演算法章節)
實例
基本結構
GUID本質上是一個16位元組(128位元)的二進制數,最常見[1]的結構如下:
位 | 位元組 | 描述 | 位元組序 |
---|---|---|---|
32 | 4 | 數據1 | 原生 |
16 | 2 | 數據2 | 原生 |
16 | 2 | 數據3 | 原生 |
64 | 8 | 數據4 | 大端序 |
數據4的位元組序和GUID顯示成文字的結果相同,而其它3個數據在小端序的機器(如英特爾的CPU)上必須先轉換成大端序。
數據4的第一個位元組的第1-3位表示所使用的GUID變種類型:
模式 | 描述 |
---|---|
0 | 向下相容網絡計算系統 |
10 | 標準 |
110 | 向下相容微軟組件對象模型 |
111 | 保留至將來使用 |
數據3最高的4位元表示版本號和所使用的演算法。
文字編碼
GUID通常會寫成16進制數的字串,如:
- 3F2504E0-4F89-11D3-9A0C-0305E82C3301
這種文字表示包括了如下部分:
16進制數的位數 | 描述 |
---|---|
8 | 數據1 |
4 | 數據2 |
4 | 數據3 |
4 | 數據4的最初2位元組 |
12 | 數據4的剩餘6位元組 |
上述表示方法通常放在一對大括號裏邊,如:
- {3F2504E0-4F89-11D3-9A0C-0305E82C3301}
當需要使用更少的字元表示GUID時,可能會使用Base64或Ascii85編碼。Base64編碼的GUID有22-24個字元,如:
- 7QDBkvCA1+B9K/U0vrQx1A
- 7QDBkvCA1+B9K/U0vrQx1A==
Ascii85編碼後是20個字元,如:
- 5:$Hj:Pf\4RLB9%kU\Lj
在URN中,GUID第一版的名字空間標識是"uuid",如:
演算法
在開放軟件基金會為計算(第一版)GUID制定的演算法中,用戶的網卡MAC地址被用於計算GUID中最後一組數字,所以就存在私隱問題,因為任何人都可以通過檔案包含的GUID追溯到最初建立這個檔案的電腦。這個漏洞曾被用於尋找梅麗莎病毒的製作者的位置[2]。在其它幾組數字中,大多數是根據生成GUID的時間決定的。
我們可以通過GUID中第三組數字的第一位是不是1來判斷它是否是第一版的GUID演算法生成的,例如{2f1e4fc0-81fd-11da-9156-00036a0f876a}。
第四版的GUID使用了新的演算法,其產生的數字是一個偽亂數。它生成的GUID的第三組數字的第一位是4,如{38a52be4-9352-453e-af97-5c3b448652f0}。對Windows API中的GUID生成器所做密碼分析顯示,因為第四版的GUID並不是真正隨機的,所以只要知道了程式內部的全部狀態,就可能預測它生成的上一個和下一個GUID的值。[3].
序列化演算法
GUID已經廣泛使用於資料庫表格的主鍵。由於主鍵需要用作索引,於是就產生了一個效能問題:當主鍵足夠隨機時,新的記錄就必須插入到原有的索引中間,而不能僅僅排在最後。
為緩解這個問題並仍然提供足夠的隨機程度以避免GUID的重複,人們就創造了一些新的演算法來生成序列化的GUID。
2002年8月,吉米尼爾森(Jimmy Nilsson)給出了第一種方法,[4]並稱之為「COMB」(combined guid/timestamp,意思是:組合GUID/時間戳)。他將GUID中數據4的最後6位元組用系統時間的最低位替換。經測試,這對隨機性的影響很小,但是有一個副作用即是其建立的時間可以從GUID中輕鬆還原。
自從Microsoft SQL Server 2005版開始,微軟在Transact-SQL中加入了一個新函數,叫做NEWSEQUENTIALID()[5],用來生成主鍵增大的GUID,但一旦伺服器重新啟動,其再次生成的GUID可能反而變小(但仍然保持唯一)。這在很大程度上提高了索引的效能,但並不能保證所生成的GUID一直增大。這個函數產生的GUID很簡單就可以預測,因此不適合用於安全目的。
2006年,一些程式設計師發現,在一些平台上的Oracle軟件中,SYS_GUID函數能返回序列化的GUID。但這個實際上是一個BUG導致的。[6].
參考資料
- ^ 存档副本. [2010-06-27]. (原始內容存檔於2010-06-23).
- ^ Tracking Melissa's alter egos (新聞稿). ZDNet. 1999-04-02 [2010-06-27]. (原始內容存檔於2012-10-21).
- ^ Design and Cryptanalysis of UUID-generator in Windows. [2010-06-27]. (原始內容存檔於2010-05-31).
- ^ InformIT. [2010-06-27]. (原始內容存檔於2010-08-26).
- ^ MSDN. [2010-06-27]. (原始內容存檔於2010-06-06).
- ^ 存档副本. [2010-06-27]. (原始內容存檔於2011-07-08).
參見
- UUID
- Security Identifier (SID)
- Object identifier (OID)
- 裝置指紋
外部連結
- CLSID Registry Key Information(頁面存檔備份,存於互聯網檔案館)
- International Standard "Generation and registration of Universally Unique Identifiers (UUIDs) and their use as ASN.1 Object Identifier components"(頁面存檔備份,存於互聯網檔案館) (ITU-T Rec. X.667 | ISO/IEC 9834-8, technically compatible with IETF RFC 4122)
- DmaId for InstanceId Values (DCE Universally Unique IDentifiers, UUIDs)
- Syntax and semantics of the DCE variant of Universal Unique Identifiers (UUIDs)(頁面存檔備份,存於互聯網檔案館)
- Generate and parse UUIDs (or GUIDs) in Java(頁面存檔備份,存於互聯網檔案館)
- UUID Generator on the ITU-T website(頁面存檔備份,存於互聯網檔案館)