Erasure Coding
什么是纠删码?
纠删码是一种以无损格式对数据进行编码的简单而快速的方法。
纠删码提供了无故障的存储环境。它是一种信息分散算法,允许数据分布在多个存储设备上。纠删码背后的想法很简单:不是将数据全部写入存储,而是将其分成更小的块,然后在需要时用于重建原始数据。
纠删码可以在不同的粒度级别上工作;例如,整个文件可以被编码为K个块,或者文件系统块可以被编码为K个独立块。
纠删码的主要优点是即使某些情况下它也可以被解码。块丢失,或者根本没有收到。它被用于不同的通信系统中,以提高对传输错误的鲁棒性。
RAID和纠删码有什么区别?
出于某种原因,RAID和纠删码被误认为是同样的事情。事实上,两者是完全不同的。
RAID 主要用于服务器和其他大型存储设备。它将您的数据镜像到多个硬盘驱动器上,因此如果一个驱动器出现故障,您还有备份。缺点是它比擦除编码更昂贵,并且在每个驱动器上占用更多空间。
RAID 实际上并不能保护驱动器上的数据不被另一台计算机读取。任何能够接触到其中一个驱动器的人仍然可以看到您的所有信息。擦除编码的作用正如它听起来的那样:它对数据进行加扰,这样没有正确的密钥就没有人可以读取它。
擦除编码将数据分成多个片段,并使用冗余信息对其进行扩展和编码。另一方面,RAID 中的数据不会被分解。
纠删码的优点
纠删码是一种以可靠的方式存储数据的方法,可以用于在存储介质的任何部分损坏时恢复原始数据。纠删码有很多好处,使其成为其他数据存储方法的有吸引力的替代方案。
纠删码的主要特点包括:
可扩展性——这种技术既可以应用于少量数据,也可以应用于大量数据。
< p>
可靠性 – 由于只保留数据片段,即使某些存储介质出现故障,也可以恢复原始数据。
性价比高 strong> – 当您考虑到无需购买额外的备份和恢复软件而节省成本时,此技术是经济高效的。
速度 – 从故障恢复所需的时间与其他方法相比,使用纠删码的单次故障时间要短得多。