新手教程：什么是校验盘，校验盘有什么作用

type

status

date

slug

summary

1、什么是校验盘（Parity Disks）

unRAID 的校验盘用于保护阵列硬盘的数据，采用奇偶校验机制来实现数据的冗余和重建。

有一块校验盘的情况下可以允许阵列中的一块硬盘损毁而不丢失数据；如果有两块校验盘则允许两块硬盘损毁而不丢失数据。

unRAID 最多只可以添加两块校验盘，并且需要注意的是，校验盘只能保护阵列里的硬盘数据，缓存池的数据不受校验盘保护。

2、校验盘的工作原理

2.1、奇偶校验的过程

校验盘通过对阵列里面所有硬盘的数据进行奇偶求和之后得到校验数据，当阵列里面有硬盘出现故障或者数据不完整时，校验盘就可以通过校验数据对数据进行重建或者校正，实现数据保护的目的。

需要说明的是，校验数据不是一般的文件数据，因此校验盘是没有文件系统格式的（如下图）。

我们知道，计算机存储数据的最小单位是比特 bit ，因此你可以理解硬盘里面的数据是一串长长的“比特流”，而这一长串的比特流是由 0 和 1 组成的，如：

图片取自 Unraid 文档手册：https://docs.unraid.net/unraid-os/manual/what-is-unraid/#parity-protected-array

在上面的图片中，阵列里面有三个硬盘，每个盘里面所存储的数据量不同，因此他们里面“比特流”（ 0 和 1 ）长短也不一样。

为了保护阵列里面的这些硬盘，此时我们引入校验盘（Parity）：

由于校验盘需要对阵列里面所有硬盘的数据进行计算，因此使用校验盘有一个硬性要求 —— 校验盘的容量一定要大于等于阵列里面最大的那一个硬盘。

比如说阵列里容量最大的那一个硬盘是 16T，那么当你使用校验盘时就必须使用大于或者等于 16T 的硬盘。

从上面的图片中可以看到，校验盘会对每个硬盘在同一位置（同一列）的数据进行奇偶求和，如果求和出来的是偶数，那么用 0 表示；如果是奇数，那么用 1 表示。

比如第一列数据中，Disk1、Disk2 和 Disk3 的数据都是 0 ，那么求和之后也为 0 （），因此校验盘就会在同一位置写入数值 0 ；而第二列的数据中是一个 1 与两个 0 ，求和出来的是奇数 1 （），因此校验盘就会在同一位置写入数值 1 ；如果是，那么得到的值是 —— 为奇数，用 1 表示。

通过上面的计算过程可以知道，不管你有多少个硬盘，最终都可以求和得出 0 或者 1 ，所以这也是为什么一个奇偶校验盘就可以实现数据保护。

在有一个校验盘的情况下，只有校验盘和一个数据盘同时损坏才会导致数据的直接丢失（不可恢复），但是这种情况很少见，一般不需要太担心。如果你实在担心，你可以再增加一个校验盘，这样即使一个校验盘和一个阵列数据盘同时损坏（或者两个阵列数据盘同时损坏），那么也不会导致数据的直接丢失。

2.2、数据的重建

如上图所示，假设 Disk 2 出现了问题以至硬盘内的数据无法被读取，那么此时校验盘借助已经存储的校验数据依然可以保证阵列数据的完整性，那么校验盘如何实现数据冗余/数据重建？

假如遇到阵列硬盘出现问题时，你可以选择将数据拷贝出来或者使用新的硬盘来进行数据重。我建议在重建数据之前可以先把重要的数据拷贝出来，如果没什么重要的数据，那么直接重建即可。

前面介绍了奇偶校验的工作原理，知道校验盘中存储的是奇偶求和之后的数据，那么当阵列中某个硬盘内的数据出现了丢失或者损毁，系统就可以使用校验数据反推得到这个硬盘上的数据，从而实现数据冗余或者数据重建。

打个比方，已知，，，求的值，那么不难算出。就相当于阵列中其他盘的数据，就相当于校验盘中的数据，和已知的情况下就可以倒推出的值。

那么具体到我们的这个例子中，校验盘在第一列位置中的校验和是 0 ，意味着在这一位置下所有的硬盘数据校验和是偶数，那么就反过来说明 Disk2 在这个位置下的数值必然是 0 ，否则奇偶求和就得不到偶数值，其他位置的数据同理：

通过这样的方式，校验盘就可以在硬盘损毁的情况下依然可以保持数据的完整性并可以实现数据的重建。

2.3 校验数据的更新机制

通过前面的介绍后，我们知道 Unraid 的奇偶校验数据是如何生成的。那么接下来我们还需要理解，在已经完成了奇偶校验的情况下，如果阵列中数据盘里面的数据发生变化（例如文件的增删改），那么此时校验盘里面的奇偶校验值会产生什么样的变化？校验数据的更新机制是怎样的？

一句话概括：当阵列中的数据盘出现“写入”操作时，校验盘上的奇偶校验信息（元数据）会进行更新，以保持整个阵列的校验一致性。

这里需要着重定义“写入”这个概念：除了读取之外，在数据盘中删除文件或修改文件都是一种对硬盘的”写入”操作，因此都会触发 Unraid 奇偶校验信息的更新机制。举例来说，当删除一个文件时，从硬盘的视角来看，文件系统会更新硬盘中的元数据区域和空间分配表，告诉系统这些数据块可以被再次使用，这些更新会直接写入到磁盘中，这实际上也是一种数据写入。

因此，当用户对阵列中的某个数据盘进行以下操作时，会触发校验盘的更新：

写入新的文件或数据块

修改已存在文件的内容

删除数据（需要对位的内容进行重新计算）

格式化（具体解释见下文“💡 补充说明：硬盘格式化并不等于“清除”硬盘”）

这些操作导致数据盘的某些比特发生变化，由于需要保持奇偶校验数据一致，Unraid 系统需要据此重新计算校验值。

💡 补充说明：硬盘格式化并不等于“清除”硬盘

不管是在 Windows、Unraid（Linux）或是其他的系统中，格式化并不意味着对硬盘进行“物理”清除，而是指在硬盘上重新创建或初始化一个文件系统。

格式化会导致文件系统的元数据会被重写（这个过程符合前面所说的“写入”概念），原有的分区结构、文件目录和数据索引会被清空。虽然这些操作让硬盘看起来像是被清空了，但实际上，存储在硬盘上的数据（比特）仍然存在，直到新的数据写入相同区域之后，此时旧数据才会被新的数据覆盖。

格式化相当于告诉文件系统，原先被占用了的数据存储位置，可以重新被使用（被写入）。

格式化并不会彻底消除硬盘上的数据。如果硬盘没有经过进一步的数据擦除或覆盖，那么仍然有可能使用数据恢复软件恢复格式化之前的文件。这是因为格式化操作通常只是删除了指向数据块的指针，而没有覆盖数据块本身。所以如果说你不小心将你的硬盘进行了格式化，那么此时不要对硬盘进行写入，因为写入会覆盖原因的数据，导致无法再进行恢复。

相对的，如果你希望对一个硬盘进行真正的“清除”，那么从硬盘底层的角度来说，你需要做的“写零”——将硬盘上所有的比特位写入 0 。当所有的比特位为 0 的情况下，才真正意味着这个硬盘的“空”的，没有任何的数据。

在本文的 Q2：往阵列里添加新硬盘会不会导致校验数据重建？ 章节中就介绍了如何在 Unraid 系统中对一个硬盘进行“写零”操作。

以 Windows 系统为例，当我们尝试格式化一个存储设备时，如果我们没有勾选“快速格式化”，那么就会采用“写零”的方式对硬盘进行清除，这个过程会很慢（读者可以拿闲置的U盘尝试一下）；而如果勾选了“快速格式化”，那么仅仅只是重新创建或初始化一个文件系统，这个过程速度会很快，这也是为什么叫做“快速格式化”。

3、常见问题

Q1：如何解决加了校验盘之后阵列写入速度变慢的问题？

A：开启 “设置 - 硬盘设置 - 可调式 (md_write_method) - 重建写入”

“重建写入”的英文原文是 reconstruct write 。

不过需要注意的是，使用“重建写入”会导致阵列里面的硬盘无法休眠，具体的原理可以参考这里的详细解释：

有空我再单独解释，最近有点忙没空细说…

Turbo write

Turbo Write technically known as "reconstruct write" - a new method for updating parity JonP gave a short description of what "reconstruct write" is, but I thought I would give a little more detail, what it is, how it compares with the traditional method, and the ramifications of using it. First,...

https://forums.unraid.net/topic/50397-turbo-write/

Q2：往阵列里添加新硬盘会不会导致校验数据重建？

A：如果你添加的是新硬盘且没有数据在里面，那么不会重建数据；但如果你添加的硬盘里面已经有数据了，且里面的数据你希望保留，那么需要重新进行奇偶校验。

前面介绍原理的时候说过，所有硬盘的数据经过奇偶求和计算之后才会得到最终的校验数据，但假设说你需要加入一块已有数据的硬盘直接使用（比如你从其他 unRAID 服务器上拿过来的硬盘），那么理论上就得重新进行奇偶求和计算，否则校验盘无法保护你的数据。

但如果说你加入进来的这个硬盘是全新的，或者说你不需要里面已有的数据，希望作为一个新的硬盘给到 unRAID 去使用，那么这种情况下可以实现不触发系统校验和的重新计算。方法很简单，那就是对硬盘进行“写零（write zero）”操作即可。一个数据全为 0 的硬盘不会影响校验盘中已有的校验值，因为 0 与其他任何值求和都不会改变最终的求和结果。

前面说过计算机存储数据的最小单位是比特 bit ，比特的值只有 0 和 1 ，所有的比特值都为 0 就意味着数据为空，因此写零也就表示对硬盘的数据进行清空。

参考说明：https://forums.unraid.net/topic/90064-is-it-necessary-to-pre-clear-drives/

unRAID 上有一个叫做 Unassigned Devices Preclear 的插件，你可以通过此插件提前对硬盘进行写零来清空数据，然后再加入到阵列中，这样就不会触发校验和的重新计算。

Unassigned Devices Preclear 插件使用方法

首先，需要进行清零的硬盘不能加入到阵列中，并且你还需要安装另外两个插件：Unassigned Devices 和 Unassigned Devices Plus 。

这两个插件的作用是可以对阵列之外的硬盘组进行分区删除或者格式化等常见的硬盘操作，还可以挂载远程共享等。

安装之后，你需要借助这两个插件去将需要清零的硬盘的所有分区删除，为此你需要开启插件的“破坏性模式”之后才可以对一个硬盘的分组进行删除：

点击硬盘 ID 右侧的 ❌ 来删除分区：

当所有分区都删除之后就会在硬盘 ID 的右侧显示一个 Unassigned Devices Preclear 插件的小图标（可点击），表示此时硬盘可以进行清零操作，如下图所示：

当点击之后弹出清零操作的具体参数设置，一般情况下按照下图的设置即可：

Cycles 选择 1 即可，选多了没必要，因为会对硬盘有损耗。

点击 START 之后就会开始执行清零操作，如下图所示：

点击 👁️ 图标会弹出当前的进度信息：

点击眼睛左边的小图标则会显示日志信息，如：

硬盘清零的操作会比较费时间，博主清零一个 4T 的盘最长的就花费了 19 个小时 30 分钟，所以读者朋友们请根据实际需要来选择要不要清零，因为有可能做校验的时间都没有这么长。

硬盘的读写速度会直接影响清零所需要的时间。

博主 4 T 硬盘做清零的日志信息参考：

Q3：更换校验盘需要怎么做？

A：直接更换即可。

校验盘存储的校验数据并不是一般的文件数据，所以校验数据独立于阵列里的硬盘数据，去掉校验盘并不会影响阵列里面的文件，因此你可以生成一个新的配置之后直接更换校验盘。

生成新配置的方法：工具（ TOOLS ） → 新配置（ New Config ）。

不过需要小心的是，更换了新的校验盘之后，在新的校验盘没完成奇偶校验之前，你的阵列数据不被保护，所以建议在这一段时间内停止对硬盘进行写入，等待奇偶校验完成之后再进行。

Q4：当我删除了硬盘的数据，已有的校验数据是不是也会被删除？

A：不会。

删除阵列硬盘里的数据不会影响已经存在的校验数据，因为校验盘就是为了保护你的数据不丢失而存在的。如果删除数据也会删除已有的校验数据，那么当你遇到硬盘损坏时，从某种程度上就好比“物理”删除了数据，那又该如何重建数据呢？

你可以参考我在 Unraid 社区里面的一个回帖：

关于奇偶校验的设置问题。

首先问一个问题，进行奇偶校验的时候是，阵列磁盘进行读取，校验盘进行写入。所以至此衍生出一个问题，如何有效设置奇偶校验的间隔，才能够在保护磁盘以及保护资料中达到平衡，因为unraid的校验不是在写入新的数据的时候就在做校验，而是需要主动开启，那是不是意味着在新的一次校验开始时，从上一次校验完成开始，到这一次校验完成结束的所有新增数据，都在裸奔。那么问题来了一块16T的硬盘做校验盘的话，比较合适的校验间隔应该设置成多久，至少应该是以两周起为单位吧，毕竟16T的校验数据都要跑至少两天

https://forums.unraid.net/topic/144291-关于奇偶校验的设置问题。/?do=findComment&comment=1300469

Q5：一次完整的奇偶校验需要花多长的时间？

A：不同的硬盘和其他因素会影响所需的时间，没有一个标准的值可以借鉴。

奇偶求和是一个“读取硬盘数据 → CPU 奇偶求和运算 → 写入求和值到校验盘”的过程，时间的长短主要受硬盘读写速度影响（CPU 性能的影响可以忽略不计），除此之外还可能有其他的因素，因此没有一个标准的时间可以让读者参考。

不过博主可以提供我自己的数据给到大家去参考：我的阵列只有一块 16T 的硬盘和一个 16T 的校验盘，完成一次完整的奇偶校验花费了 22 小时 42 分 32 秒，平均读取速度为 195.7 MB/s。

我这个校验的速度算是快的了，因为我的阵列里面只有一个 16T 的数据盘，如果数据盘多一点可能就没这么快了。

如果按照我的数据去衡量奇偶校验的时间，那么每 1T 数据所花费的时间大约为 1.45 个小时，因此：

如果你最大的那个盘是 6T，那么大概需要 8.7 小时完成一次完整的奇偶校验；

如果你最大的那个盘是 8T，那么大概需要 11.6 小时完成一次完整的奇偶校验；

如果你最大的那个盘是 10T，那么大概需要 14.5 小时完成一次完整的奇偶校验；

如果你最大的那个盘是 12T，那么大概需要 17.4 小时完成一次完整的奇偶校验；

如果你最大的那个盘是 14T，那么大概需要 20.3 小时完成一次完整的奇偶校验；

如果你最大的那个盘是 18T，那么大概需要 26.1 小时完成一次完整的奇偶校验；

Q6：我是不是可以利用校验盘来实现数据的转移？

A：可以，但请不要这么做。

比如说你希望将阵列里某个硬盘内所有的数据转移到新的硬盘上，你可以将这个旧的硬盘直接拿出来，然后用新的硬盘在阵列中替换旧的硬盘，这样就可以利用校验盘在新的硬盘上去重建数据，从而实现数据的转移/恢复。但是非常不建议这么去做，因为校验盘的数据重建功能不应该作为一种常规的数据备份/转移的手段。

大家需要明白的是，不管是校验盘还是 Raid 阵列，数据的冗余功能都不应该作为日常数据备份或者数据转移的手段。因为数据冗余的目的是为了让你在遇到数据丢失的情况下，依然可以保证数据的完整性，从而不让你的系统崩溃或者业务下线，你要做的应该是尽快将重要的数据进行备份（拷贝到别的地方），然后用正常的硬盘替换掉损坏的硬盘来重建数据。

数据的重建并不是百分百成功的，所以也有不少人建议普通个人用户尽量不要去使用诸如 Raid5 阵列这样的 Raid 机制，因为发生过不少重建数据时其他硬盘也损坏的情况（尤其是同批次生产出来的硬盘）。比如 Raid5 重建过程中如果某个硬盘也坏掉了，那么整个阵列将直接损毁，数据也就直接丢失无法恢复；并且 Raid 阵列数据恢复是一个门槛比较高的技术活，没有经验和知识储备的普通用户遇到此类问题往往无从下手。因此我建议一般的用户尽量做好重要数据的备份才是最保险的手段。

参考：

在有校验盘的情况下，如何无损更换阵列的硬盘。

目前是一个校验盘，两个数据硬盘作为阵列。是不是可以这样做：1，关机，2，拔掉一块阵列数据盘A，换上一块新硬盘。3，开机。4，开机之后怎么操作。是不是系统会根据校验盘自动在新的硬盘里恢复拔掉的数据盘A的所有数据？进阶问题： 1，如果有两个校验盘，是不是我可以同时拔掉两个数据盘，更换2个新的硬盘，然后系统根据校验盘会自动恢复2个数据盘的所有数据？ 2，如果我不是更换数据盘，而是更换校验盘，是不是也是一样的操作。我的目的是每隔一定时间，比如一年，更换一批unraid下面的所有硬盘。进阶问题2 如果是要更换缓存盘，而缓存盘只有一个。怎么操作。