大数据时代区块链是如何助力数据开放共享的(区块链可以为数据共享带来哪些改变)

大数据时代区块链是如何助力数据开放共享的

文丨黄艳芳(方塘智库科创中国研究中心实习研究员)

大数据时代区块链是如何助力数据开放共享的(区块链可以为数据共享带来哪些改变)
(图片来源网络,侵删)

随着互联网信息化技术的快速发展,以及云计算、物联网技术的逐步成熟,一个大规模生产、分享和应用数据的时代已经开启。但在数据***的开发利用中,数据的开放共享难题成为了大数据快速发展道路上最大的瓶颈之一。

《区块链大数据:突破瓶颈,开启智能新时代》一书作者杨永强、蔡宗辉等人,深耕大数据领域多年,针对目前大数据发展的困境,提出用区块链技术破解大数据发展难题。

大数据时代区块链是如何助力数据开放共享的(区块链可以为数据共享带来哪些改变)
(图片来源网络,侵删)

本书主要讲述了大数据发展面临的五大困境,区块链发展的三个阶段以及区块链技术的七大行业应用,同时作者对区块链和大数据在各方面的融合发展趋势进行了预测。其中,作者关于“区块链与大数据结合,打破数据孤岛,建立一个开放的数据共享生态体系”的观点,值得进一步讨论。

该书对传统的大数据从业者以及需要了解区块链思想在大数据领域具体应用的人都具有很好的启发意义。

大数据时代区块链是如何助力数据开放共享的(区块链可以为数据共享带来哪些改变)
(图片来源网络,侵删)

1

已经开启的区块链3.0时代

区块链从提出到今天,一共经历了三个主要的阶段,作者将其概括为“以‘货币’为代表的区块链1.0、以‘合约’为代表的区块链2.0和现在具有极大应用潜力的区块链3.0。”

区块链1.0时代主要利用分布式账本、公开透明的特点解决货币和支付手段中的信任问题;区块链2.0的改革更加宏观,规模更大,智能合约能够实现各种资产在区块链上的注册、存储和交易,由此,区块链开始在证券交易等诸多领域逐渐应用落地;区块链3.0时代由于Token的出现,每个区块链成员都能成为生产资本的所有者,将拥有更大的主导权。

通过书中对区块链1.0到区块链3.0不同阶段的简单介绍,我们能够了解到,在区块链1.0和2.0基础上,区块链3.0的应用范围将更加广泛,由原来的金融扩展到医疗、传媒等多个领域。并且,在区块链3.0时代,分布式存储技术、密码学、智能合约和共识机制等区块链四大核心技术更加成熟,区块链应用落地将更加扎实稳妥。

在大数据时代,数据将整个世界联系地更加紧密,几乎所有行业的发展都会涉及数据的收集、分析和使用,离不开大数据的支撑,因此。数据的开放共享成为重中之重。但由于一些技术和商业模式上的掣肘,数据开放共享变得十分困难,亟需快速有效地搬掉这些“绊脚石”。

区块链的出现给我们带来了巨大的新的想象空间。

2

区块链为数据开放共享保驾护航

区块链为大数据发展突破瓶颈提供了可能的解决方案。比如,区块链以其可追溯性、安全性和难以篡改的技术将在解决数据开放共享的难题上发挥巨大作用。

书中提到“在数据***集层面,区块链能够解放更多的数据;在数据存储层面,区块链是强背书的数据库存储技术;在数据分析层面,区块链授权后相关机构才能访问数据”。

这些都对大数据发展面临的数据孤岛、数据安全与信任难题进行了回答。

首先是数据孤岛难题。作者在书中提到,目前大数据产业发展的困境之一就是“信息壁垒严重”,通过对“谷歌预测流感”***的介绍,指出“数据必须要经过流通互动才能产生更大的价值。”但是,在实际进行数据关联时,并没有想象的那么简单。

由于数据中蕴含着宝贵的商业利益,各大企业不会随便开放自身拥有的数据。以搜索引擎为例,众所周知,谷歌的搜索效果要比其他浏览器更好。但实际上他们之间的技术大同小异,真正造成差异的原因是谷歌的用户数量更多,积累的数据量更大,从而各种用户特殊的搜索需求都能在大数据中找到最佳的应对策略。而其他搜索引擎在这一点上差很多,进而造成用户量始终上不去的恶性循环。所以,谷歌不可能随意开放自己的数据库。

对于企业来说,独占数据能够保证自身的商业利益、信息安全,他们会基于商业需求尽可能地将数据独占,而不是开放。但数据流通是数据经济的基石,如果不及早解决数据孤岛问题,就会发展成为数据垄断,阻碍行业的健康发展。

另外,数据安全与信任问题也层出不穷。数据***分散在不同企业组织中,想让不同行业的数据发生关联,必然需要将数据交付给另一方企业,或者双方将数据交付至一个共同的第三方平台并以交易的形式进行数据交换,这也是大数据产业目前最常见的商业模式。但在这种商业模式下,买卖数据双方处于互不信任的状态,找不到一个可信任的技术手段背书,数据无法完全流动起来。

由于数据的特殊性,大数据***能否保证数据不被泄露也成为阻碍大数据交易的重要原因。数据的安全和信任问题也成为了大数据产业难以打通数据壁垒的重要因素。

行业内外的共识是,面对一个个数据孤岛和信息壁垒,纵使有再好的能力也无计可施。

那么如何能让共享数据的价值凸显,冲破数据孤岛的壁垒呢?作者在书中给出了自己的答案。

区块链技术近几年横空出世,为很多行业难题提供了全新的解决思路,针对上述难题,或许可以结合区块链技术进行思考。

作者提出“要建立去中心化的数据流通平台,去除中心化***。”这确实给大家提了个醒:中心化平台占据互联网领域主导地位时间之久,导致我们已经逐渐忘记去中心化平台也能够撑起互联网服务的角色。

区块链以分布式记账的形式记录交易信息,使用P2P网络架构,因此在交易过程中没有第三方平台参与,自然不存在第三方平台欺瞒的风险。除此之外,区块链上的数据只有经过数据生产者的授权,才能够为链上任何一个被授权方所用,这样可以从根本上阻止数据孤岛的出现。

数据安全是数据开放共享的基础,区块链能够确保数据的安全性,这是由它的系统架构决定的。作者在书中提出,“当大数据中嵌入区块链技术,就能够依靠区块链的不可更改性来保障交易记录不被篡改。”

关于这一点,作者的表述并不准确。根据“51%算力攻击”的说法,当系统中有合作关系的恶意节点所控制的算力,超过诚实节点所控制的算力,系统就有被攻击的风险。所以区块链具有“难以篡改性”或“难以更改性”,而不是“不可更改性”。

区块链系统由无数个节点构成,这些节点类似于一个个独立工作的计算机,当需要记录数据时,每个节点都会参与进来,系统里的所有节点都拥有一个完全一样的数据区块。一般情况下,区块链系统中的节点数量成千上万,能够控制大部分节点的可能性极低,数据被篡改的可能性也会极大降低。

书中“微信聊天记录”的例子能很好地解释这一点:一个微信群可能有成百上千位成员,每个人手机都有一份完整的聊天记录,如果有人想要修改或者删除聊天记录,也只能修改自己手机的聊天内容,修改或者删除其他成员的聊天记录的可能性极低。因此,区块链能够确保数据的安全性。

另外,区块链中的数据从***集到交易再到使用,全过程都会被节点如实记录,这样就使得数据的流通过程是全网透明公开的。至此,交易双方无需担心数据的安全和信任问题。

3

区块链可以推动对个人隐私的保护

作者虽然没有用专门的章节谈论隐私保护,但在探讨数据的开放共享时,隐私问题是无法回避的。隐私保护一直以来都是大数据发展的一个掣肘,大数据时代所需要的数据开放共享实际上和保护个人隐私之间是存在剧烈冲突的。

《大数据隐私保护技术与治理机制研究》书中指出“大数据时代下的隐私以个人数据为载体的形式存在于网络之中。”面对个人数据带来的巨大经济效益的诱惑,企业会使用各式各样的方法搜集个人数据。

《过滤泡:互联网对我们的隐秘操纵》一书中曾提到用户会主动用自己的隐私去换取自己感兴趣的相关信息,而在这个过程中,用户是无意识的。

因此,个人隐私很容易就能被触及,我们在网络中的一举一动时刻以数据的形式发送给数据服务商。用户作为数据归属权的主人,却不知道哪些数据如何被收集了,这些数据未来会出于什么目的、流向哪里、被谁使用,整个过程对用户来讲就如同一个神秘的黑箱。

随着用户越来越不愿意分享自己的个人数据,以及隐私保护意识逐渐增强,这在客观上也会对数据的开放共享带来不利影响。大数据技术和个人隐私产生了剧烈冲突,必将会对整个社会产生深远影响,因此大数据的发展必须解决个人隐私保护的问题。

区块链能够通过加密技术、安全多方计算等技术让只有获得授权的人才能对数据进行访问。这样一来,数据主体能够自主控制其数字身份凭证和个人资料,将数据主导权牢牢掌握在自己手中,个人隐私不会被无限制地滥用,这将极大提升用户分享个人数据的意愿。

另外,依靠区块链技术搭建的相关平台,在不访问原始数据的情况下能够进行数据分析,既可以对数据的隐秘性进行保护,又能够安全地进行数据共享。

综上所述,从这本书中我们能够了解到,区块链可以保障并促进数据的开放共享,而开放共享将破解大数据发展的困境,逐步推动形成社会化的数据流通网络,带动数字经济的快速增长

但不可否认的是,这本书对“区块链技术在数据开放共享层面的应用”研究只是初步探索,对在实际应用过程中可能遇到的一些问题欠缺思考,比如现行制度如何进行适配性调整、如何监管和把控区块链给数据开放共享模式带来的改变,等等。除了书中为我们描绘的区块链助力数据开放共享的美好图景之外,这些仍需要我们进一步关注。

推荐书籍

书名:《区块链大数据:突破瓶颈,开启智能新时代》

作者:杨永强、蔡宗辉、刘雅卓

出版社:机械工业出版社

出版时间:2019年6月

内容简介:

这本书从区块链与大数据结合的高度,生动地描述了两者共生、交融和共同演化的万般可能,阐述了区块链与大数据具体融合的方法。作者在书中提到,区块链技术能够将数据的使用权还给用户,从根源上解决了数据滥用的问题,为数据的开放共享带来新的进展,为相关从业者提供了非常有价值的参考。

编审:张梦欣丨编辑:徐丰超丨设计:孙月园

区块链可以为数据共享带来哪些改变

区块链可以为数据共享带来哪些改变
当前,在社交网站上共享文字和照片,并分享彼此的喜怒哀乐,已经成为大众生活的重要组成部分。
随着时代的进步,共享正逐步走入实体社会,共享单车、共享雨伞、共享充电宝、共享汽车等一系列共享经济模式横空出世,给人类的生活带来了巨大的便利。
作为一种分布式共享账本,区块链技术似乎天生就和共享密不可分,业界人士也不断宣称这种技术能给共享带来革命性的进步。
那么,区块链式共享与互联网式共享究竟有何不同呢?本文以数据共享为例,对这一问题进行解答。

区块链共享的不仅仅是数据
数据共享是人与生俱来的需求,比如,在咖啡馆谈人生理想、执笔书写文字等等,这些都是普通人用来和他人交流信息的重要方式。
互联网的出现,打破了数据共享在地域和时间方面的限制,它可以让不同人在地球的不同位置进行即时交流,电子邮件、网上即时通讯等技术的出现大大提高了信息传输的效率。
此外,互联网可以汇集海量的数据,提供了比纸质档案更大的容量,让用户在很短的时间内获取丰富的信息。
那么,在区块链技术下,这一切有何不同呢?
事实上,区块链技术关心的并非是数据的共享,而是数据控制权限的共享,此处的权限主要是指数据的修改和增加的权力,它主要包含两个含义:
一是谁可以进行数据的修改
二是以何种方式进行修改。
在互联网模式下,数据读取、写入、编辑和删除一般都伴随着身份认证操作,只有特定的人才能对数据进行修改,而在区块链模式下,尤其是公有链体系下,任何人都可以参与对数据的读写,并且以分布式账本的方式构建了一个去信任的系统,参与读写的各个组织或个体可以互不信任,但能对系统存储数据的最终状态达成共识。
简单地说,区块链式共享和互联网式共享的本质区别在于区块链共享的不仅仅是数据,而是数据的控制权。那么,区块链究竟怎样处理数据控制权呢?
区块链通过规则来控制数据
在区块链技术出现之前,互联网数据通常是被单一实体控制的。由于网站运营方完全控制了中央服务器,这些组织可以随意地编辑和处理数据。虽然组织也需要在一定的法律和协议下完成数据修改等行为,但由于其是掌握***的一方,个人用户很难享有完全的控制权。
举一个简单的例子,某一用户上传了一张照片到网站平台上,并且希望朋友们能看到这张照片。排除掉一些非法要素,这张照片最后的控制权是归谁呢?
显然,从用户的角度来看,这张照片是归自己所有的,但事实上,这些社交网站才是真正的控制方,他们可以随意的进行修改,用户却毫无办法。
也就是说,在现有互联网体系下,只要掌握了网站平台的运营权,就能完全地控制平台上的数据。
而在区块链体系下,数据不被任何权威方掌握,其权限是由规则来进行控制的,这些规则的主要目标是来规定什么样的信息是有效的,同时还规定了参与者应当如何对其进行反馈。
这些规则通常是预先定义的,加入区块链网络的参与者必须遵守规则。当然,从技术上来说,参与者可以自行忽略某些规则,并根据自身利益来构建一些无效的数据。但是,由于区块链共识机制的存在,其他参与者可以根据预定义的规则将这些无效数据排除在网络之外。
比如,在苏宁金融上线的区块链黑名单共享平台系统中,就有很多这样的规则——没有积分不得查询数据,本机构数据只有本机构有权限修改,等等。一旦有机构做了一次规则外的操作,这些操作会作为无效交易,禁止其发生。
总的来说,区块链根据技术层面的规则体系来规范数据的写入行为,而互联网是通过权力和***来控制数据,这是区块链式共享和互联网式共享的根本性区别。
区块链规则由参与者共同维护
虽然在互联网环境内,也存在着一些规则,但是由于规则完全是由权力方来维护的,难以避免会出现暗箱操作等行为。而在区块链体系内,规则是由所有参与者共同维护的,各参与方都会根据规则来独立的验证数据。
在这一过程中,我们并不能***设所有参与者都能完全依照规则,因此,每一位参与者都会独立的验证其接收到的数据,并判断其是否违反规则。如果核实数据是有效的,那么参与者就会接受这份数据,并将其转发给其他人,否则,就会直接拒绝。
在区块链网络内,只有当相关参与者同意后,新数据才能被视为有效数据,并将其加入到最终的区块链共享账本中。
根据区块链的构造方式,数据的确认方式有较大的区别,比如,在公有链中,需要大部分参与者都同意数据的有效性,而在联盟链或私有链中,只需要少数参与者同意即可。
在这种方式下,参与者自身就是管理者,这就是区块链去中心化最为核心的表现形式:没有机构高人一等,具有完全的数据的控制权限。
区块链是以权限分享的形式,让每个参与者同时作为数据提供方、验证方和使用方,共同维护区块链数据的安全和有效性。
自从区块链火热之后,万物皆可区块链似乎成为行业的广告词,尤其是一些数据共享型应用会被认为是区块链的极好案例。
事实上,互联网的出现已经在一定程度上解决了数据共享的问题,区块链实现的是权限的共享,这才是区块链给业界带来的最革命性的变化。

区块链与大数据存储究竟有着怎样的关系

区块链和大数据存储的关系如下:
一、数据安全:区块链让数据真正“放心”流动起来
区块链以其可信任性、安全性和不可篡改性,让更多数据被解放出来。用一个典型案例来说明,即区块链是如何推进基因测序大数据产生的。区块链测序可以利用私钥限制访问权限,从而规避法律对个人获取基因数据的限制问题,并且利用分布式计算***,低成本完成测序服务。区块链的安全性让测序成为工业化的解决方案,实现了全球规模的测序,从而推进数据的海量增长。
二、数据开放共享:区块链保障数据私密性
***掌握着大量高密度、高价值数据,如医疗数据、人口数据等。***数据开放是大势所趋,将对整个经济社会的发展产生不可估量的推动力。然而,数据开放的主要难点和挑战是如何在保护个人隐私的情况下开放数据。基于区块链的数据脱敏技术能保证数据私密性,为隐私保护下的数据开放提供了解决方案。数据脱敏技术主要是***用了哈希处理等加密算法。例如,基于区块链技术的英格码系统(Enigma),在不访问原始数据情况下运算数据,可以对数据的私密性进行保护,杜绝数据共享中的信息安全问题。例如,公司员工可放心地开放可访问其工资信息的路径,并共同计算出群内平均工资。每个参与者可得知其在该组中的相对地位,但对其他成员的薪酬一无所知。
数据HASH脱敏处理示意图
三、数据存储:区块链是一种不可篡改的、全历史的、强背书的数据库存储技术
区块链技术,通过网络中所有节点共同参与计算,互相验证其信息的真伪以达成全网共识,可以说区块链技术是一种特定数据库技术。迄今为止我们的大数据还处于非常基础的阶段,基于全网共识为基础的数据可信的区块链数据,是不可篡改的、全历史的、也使数据的质量获得前所未有的强信任背书,也使数据库的发展进入一个新时代。
四、数据分析:区块链确保数据安全性
数据分析是实现数据价值的核心。在进行数据分析时,如何有效保护个人隐私和防止核心数据泄露,成为首要考虑的问题。例如,随着指纹数据分析应用和基因数据检测与分析手段的普及,越来越多的人担心,一旦个人健康数据发生泄露,将可能导致严重后果。区块链技术可以通过多签名私钥、加密技术、安全多方计算技术来防止这类情况的出现。当数据被哈希后放置在区块链上,使用数字签名技术,就能够让那些获得授权的人们才可以对数据进行访问。通过私钥既保证数据私密性,又可以共享给授权研究机构。数据统一存储在去中心化的区块链上,在不访问原始数据情况下进行数据分析,既可以对数据的私密性进行保护,又可以安全地提供给全球科研机构、医生共享,作为全人类的基础健康数据库,对未来解决突发疾病、疑难疾病带来极大的便利。
五、数据流通:区块链保障数据相关权益
对于个人或机构有价值的数据资产,可以利用区块链对其进行注册,交易记录是全网认可的、透明的、可追溯的,明确了大数据资产来源、所有权、使用权和流通路径,对数据资产交易具有很大价值。
一方面,区块链能够破除中介拷贝数据威胁,有利于建立可信任的数据资产交易环境。数据是一种非常特殊的商品,与普通商品有着本质区别,主要是具有所有权不清晰、 “看过、***即被拥有”等特征,这也决定了使用传统商品中介的交易方式无法满足数据的共享、交换和交易。因为中介中心有条件、有能力***和保存所有流经的数据,这对数据生产者极不公平。这种威胁仅仅依靠承诺是无法消除的,而这种威胁的存在也成为阻碍数据流通巨大障碍。基于去中心化的区块链,能够破除中介中心拷贝数据的威胁,保障数据拥有者的合法权益。
另一方面,区块链提供了可追溯路径,能有效破解数据确权难题。区块链通过网络中多个参与计算的节点来共同参与数据的计算和记录,并且互相验证其信息的有效,既可以进行信息防伪,又提供了可追溯路径。把各个区块的交易信息串起来,就形成了完整的交易明细清单,每笔交易来龙去脉非常清晰、透明。另外,当人们对某个区块的“值”有疑问时,可方便地回溯历史交易记录进而判别该值是否正确,识别出该值是否已被篡改或记录有误。
一切在区块链上有了保障,大数据自然会更加活跃起来。
币盈中国平台上众筹项目的代币都是基于区块链技术开发出来的,相关的信息都会记录到区块链上。

区块链在大数据中的作用有哪些?

【导读】大数据给各行各业带来极大机会的同时,也带来了诸多应战。而区块链以其去中心化、去信任化、通明度高和不行篡改的特性,可认为大数据赋予更高的安全性、通明性和隐私性。那么,区块链在大数据中的效果有哪些呢?

一、改善数据质量

区块链的实质是一种去中心化的分布式账本。它也可以理解为是一种不行篡改的、全前史的、分布式数据库存储技术。所以区块链技术可以令更多的数据被解放出来,区块链技术的可信固执、安全性、和不行篡改性从根本上带来了数据质量的提高,以及数据检验能力的增强。

二、处理数据孤岛问题

大数据存在非常严峻的数据孤岛问题,很多数据目前是无法获取的。而区块链则有望处理这一问题。之所以会这样说,主要是因为区块链不仅是一个分布式账本,还具有去中心化、开放性等特征。作为金融市场中的秩序维护者,监管组织还可以通过区块链中的数据链条来预测和剖析或许出现的危险问题。

三、处理数据泄露问题

从实质上来讲,区块链其实是一个去中心化的数据库,因此,***如区块链中的某个节点数据产生变化的话,那么其他节点会在第一时间发现,这样数据泄露的或许性会大幅度降低。只要通过私钥的形式,区块链中各个节点的身份信息才可以被成功获取,并且只要数据拥有者才可以知道私钥。

四、区块链可以保障数据的相关权益

关于个人或组织有价值的数据资产,可以使用区块链对其进行注册,买卖记载是全网认可的、通明的、可追溯的。清晰了大数据资产来源、所有权、使用权和流转路径,这对数据资产买卖具有很大价值。

五、区块链的可追溯性

数据从***集、买卖、流转,以及核算剖析的每一步记载,都可以留存在区块链上,从而令数据质量获得史无前例的强信任背书。同时也保证了数据剖析成果的正确性、和数据发掘的效果。

以上就是小编今天给大家整理发送的关于“区块链在大数据中的作用有哪些?”的全部内容,希望对大家有所帮助。所谓不做不打无准备之仗,总的来说随着大数据在众多行业中的应用,大数据技术工作能力的工程师和开发人员是很吃香的。

使区块链技术在什么等方面发挥更大作用

区块链技术在数据流通和共享等方面将会发挥更大的作用。
区块链技术将大大优化现有的大数据应用, 未来互联网、人工智能、物联网都将产生海量数据,现有中心化数据存储 (计算模式)将面临巨大挑战,基于区块链技术的边缘存储 (计算)有望成为未来解决方案。再者,区块链对数据的不可篡改和可追溯机制保证了数据的真实性和高质量,这成为大数据、深度学习、人工智能等一切数据应用的基础。最后,区块链可以在保护数据隐私的前提下实现多方协作的数据计算,有望解决“数据垄断”和“数据孤岛”问题,实现数据流通价值。

针对当前的区块链发展阶段,为了满足一般商业用户区块链开发和应用需求,众多传统云服务商开始部署自己的BaaS (“区块链即服务”)解决方案。区块链与云计算的结合将有效降低企业区块链部署成本,推动区块链应用场景落地。

金窝窝是如何将区块链和大数据结合的?

简单的说,区块链和大数据都是热门的话题,大数据的发展早于区块链,目前已经成为了一个庞大的产业,而将发展中的区块链技术与大数据相结合,就会碰撞出不一样的效应。从技术角度看,大数据技术用信任换取了计算***,而区块链技术用计算***换取了信任,所以两者的结合就掀起了信息安全的新浪潮。

基于区块链分布式数据存储、去中心化、不可篡改、可追溯、可信任等特性,金窝窝网络科技集团组建了强大的区块链研究团队,目前,金窝窝已经申请区块链专利技术3项。未来,金窝窝集团将深度研究以区块链为底层技术的大数据服务,力求构筑平台上个人、企业之间的信用关系,沉淀信用数据,为企业的商业模型设计和精准营销提供解决方案,促进互联网乃至整个社会信用体系的发展。