写入时复制

写入时复制(英语:Copy-on-write,简称COW)是一种电脑程式设计领域的优化策略。其核心思想是,如果有多个调用者(callers)同时请求相同资源(如内存或磁碟上的数据存储),他们会共同获取相同的指针指向相同的资源,直到某个调用者试图修改资源的内容时,系统才会真正复制一份专用副本(private copy)给该调用者,而其他调用者所见到的最初的资源仍然保持不变。这过程对其他的调用者都是透明的。此作法主要的优点是如果调用者没有修改该资源,就不会有副本(private copy)被建立,因此多个调用者只是读取操作时可以共享同一份资源。

应用

虚拟内存管理中的写时复制

一般把这种被共享访问的页面标记为只读。当一个task试图向内存中写入数据时,内存管理单元(MMU)抛出一个异常,内核处理该异常时为该task分配一份物理内存并复制数据到此内存,重新向MMU发出执行该task的写操作。

数据存储中的写时复制

Linux等的文件管理系统使用了写时复制策略。

数据库伺服器也一般采用了写时复制策略,为用户提供一份snapshot。

软件应用中的写时复制

C++标准程序库中的std::string类,在C++98/C++03标准中是允许写时复制策略。但在C++11标准中为了提高并行性取消了这一策略。[1] GCC从版本5开始,std::string不再采用COW策略。

std::string x("Hello");
std::string y = x;  // x 和 y 使用相同的 buffer
y += ", World!";    // y 现在用了不同的 buffer,而 x 用原来的 buffer

PHP中,除了引用类型外,其他类型都是以写时复制的方式实现的。例如,字符串和数组是通过引用传递的。当它们被修改时,如果它们的引用计数不为零,就会复制一份。这使得它们可以像值类型一样使用,而不会有赋值时复制的性能问题。[2]

参考文献

  1. ^ Concurrency Modifications to Basic String. Open Standards. [2015-02-13]. (原始内容存档于2021-02-24). 
  2. ^ Pauli, Julien; Ferrara, Anthony; Popov, Nikita. Memory management. PHP Internals Book. 2013 [2023-11-17]. (原始内容存档于2023-11-10) (英语).