工程师眼中的区块链技术

Diane ·

更新时间:2024-11-11

· 718 次阅读

工程师眼中的区块链技术

有朋友问到：“我们现在的区块链技术与传统的云计算，或大厂的 BAAS 核心差异是什么？”那今天我借此机会就在这里聊聊我眼中的区块链技术。先声名一下，文件中所有技术观点均仅代表我个人观点，也不具备权威性。供大家一起讨论。

系统抽象

首先，我认为区链是一个分布式计算机系统。为了方便后文的描述，我先对分布式计算要系统个简单的抽象。
在这里插入图片描述
我先将每台计算机抽象成计算、存储、网络三个部分，我的定义如下：

存储：对数据进行执久化存储的硬件及软件。计算：对原始输入数据进行处理，输出新数据的硬件及软件。网络：将单个计算单元进行互连互通的硬件及软件。

基于此，我就将分布式计算机系统定义为：各个独立的计算机单元通过网络连接在一起，共同组成特定的功能形态，从而形成分布式计算机系统。

那接下我将从以上三方面，分别谈一下我对区块链技术的理解。

存储

讲到存储，我先从大家熟悉的单计算机单元存储说起。

在这里插入图片描述

单计算机存储，上面有一块磁盘（即使有些有两块及上磁盘，但也不做冗余存储）。存储数据（如一张照片）的操作，就是将数据存到这块磁盘上；在需要查看时，可以随时打开这台计算机，将数据从磁盘读取出来。

在这样的存储场景下会发现：

数据会因单个磁盘损坏而丢失；单个磁盘容量有限，数据量大时，无法再存储。

在个人使用上，一般不会有太大的问题，但在企业级应用场景下，以上两个缺点往往就变得不可接受。其选择可以是专用的存储服务器（如 EMC 的存储设备）。

在这里插入图片描述

存储服务器采用很多磁盘组成磁盘阵列，当存储为数据时，会首先将数据分片，每个分片存在不同的磁盘下，并且使用数据分片计算校验片，将校验分片也存于不同的磁盘中，形成冗余存储（如 RAID5）。

当单块磁盘损坏时，可自动恢复数据；也可以从一定程度上解决了存储容量问题。存储服务器有很多好处，比如性能非常高。数据隐私好。但它也存在一些问题，如：

存储服务器整体损坏会导致数据丢失。单台存储服务器下电（停电），存储服务不可用。磁盘容量仍有上限。

当然了，专用的存储服务器是非常昂贵的。为了解决以上问题，现在大家可能更倾向于使用分布式存储。

在这里插入图片描述

分布式存储将数据冗余存储在不同的物理位置多台计算机单元上。可解决：

因单个存储节点损坏而导致数据丢失；因单个存储节点不在线而导致存储服务不可用；存储容量在理论上没有上限。

现在大家好像对分布式存储用得都挺好的。那么，有没有想过分布式存储的以下问题呢？

在这里插入图片描述

当前分布式存储解决方案均在一个企业内部，即所有的存储节点对企业内部均可信。存储并不能跨企业的不可信边界。对于最终的存储消费都而言，数据可能因企业倒闭而丢失。数据受控于某家企业，可能存在隐私及数据泄漏风险。

那么针对以上问题，区块链技术是一个可行的方案。（也许它不是一个唯一的方案）

在这里插入图片描述

采用区块链技术的存储（如存证）是将数据冗余正确存储到很多不同物理位置且相互不可信的存储节点上。

要做到以上几点是不容易的，需要使用一些技术手段来保证。

1.首先面临的问题是：
**数据正确存储：**任何时间从任一存储节点均可以读取到一致的数据，且与存储时相同。
要做到这一点就要引入共识机制（做过区块链的朋友也许就会知道，要在一个不可信的分布式场景下做出一致性的共识不是一件容易的事，需要有诸多难点需要解决，在此不展开。），要求所有节点写入的数据都是一致的。而 CITA 当前采用的是类 PBFT 共识，大概思路是一次只选择一个存储节点可以写数据；其它节点同步并验证数据。

2.接下来，面临的第二个难点是：
存储节点相互不可信，保证数据不被单个存储节点更改。其中包括已经正在写入的数据及已经写入的数据。简单地说，你可以看到数据，但不是你想改就能任性地改。

区块链解决的技术是：

数据根据时间线形成链结构（区块链），其中任何数据变改，都会使数据验证不通过。所有存储写点验证所写入的数据。

在这里插入图片描述