array(2) { ["lab"]=> string(3) "502" ["news"]=> string(3) "216" } 在区块链上进行科学研究和数据共享:理念与举措 - 区块链+学术 | LabXing

区块链+学术

简介 探讨区块链技术在学术研究中的潜在革命性应用

分享到

在区块链上进行科学研究和数据共享:理念与举措

作者:赵斌教授,复旦大学生命科学学院。

区块链是一项革命性技术。从其对不同行业和部门的潜在影响来看,这种状况恰好与互联网发展初期的情况极为类似。全球技术公司Digital Science去年年底发表了一份报告“Blockchain for Research”(科学研究中的区块链),对区块链支持下的学术交流新范式进行了展望。本文的认识主要来自这份报告。该报告认为:区块链技术有望解决目前学术研究和学术交流中所面临的一些最突出的瓶颈问题,包括学术交流成本、开放性和科学信息的传递等等

比特币背后技术的区块链,让全球的投资者陶醉不已。现在区块链技术正在试探性地向科学界进发,因为它有望对科学研究的一些关键要素进行改革。区块链技术可以创造出无法篡改的数据轨迹,并且能够安全地记录论文出版过程中的一系列节点,因此可以改善可重复性和同行评议过程。

目前在全球范围内,进行类似尝试的项目并不少见。例如,有一个称为Scienceroot的计划,准备募集2千万美金,为它的电子期刊以及合作平台上的同行评议专家和作者支付酬劳。它计划在2018年初把支付用的部分“科学代币”换成以太币这种电子货币,以此完成资金募集;为研究人员广泛使用的代数程序 Wolfram Mathematica ,也在支持一个叫做Multichain的开源区块链平台的建设。根据Multichain的说法,在这个平台上,科学家可以上传数据到一个共享的开放工作区里,而这个工作区不为任何特定用户所控制。

区块链技术,无疑可以帮助科学家可靠地收集和保存有关研究活动的数据。根据伦敦研究技术公司Digital Science的特别项目主管Joris van Rossum的说法,那些公开发表的文章如果没有对其方法进行充分解释,那么在区块链的帮助下我们就更容易重现结果;区域链也可用于跟踪同行评审过程中的每笔事务,这种方式认可评审人的付出,或许还能给他们支付数字货币作为奖励,这样就可以使大家信任同行评议的过程。公开的区块链还可以提供以前没有记录的信息,比如研究人员采集数据的频率,这样除了发表的论文以及引用次数以外,人们又多了一些可供评价的指标

在区块链上工作,意味着无论何时何地,研究人员以任何方式在任何阶段创建的内容或与内容进行的交互,都将存储在一个平台中。但这里需要注意的是,虽然所有的活动和交互(如内容提交,引用)都将存储在区块链中,但这并不意味着可以通过该平台实时访问信息的原始形式。虽然上述的Scienceroot与加密货币的公开区块链技术用的是同一套机制,但这种货币形式的区块链显然不适合于科学存档数据,因为记录每笔交易都会产生经济成本,而且这种成本很快积少成多。更麻烦的是,研究过程中成本增加的速度会比加密货币快,因为现代科学会产生比后者多得多的数据。那么如何实现呢?简单的做法是:区块链仅存储不可改变的数据线索,这是可随意公开的,但无法被操纵,而原始内容的链接包含在区块链中

那么,我们是否可以构想一种新的方式呢?星际文件系统(IPFS,The InterPlanetary File System),就是被设计为通过对等网络创建永久且去中心化的存储和共享文件的方法。在这种分布式文件系统中,它所连接的计算设备都拥有相同的文件管理模式。

说到IPFS,我们这里有必要与HTTP进行比较来做更多说明。大家或许对HTTP这个协议并不陌生,HTTP是一场革命,在过去数十年时间里将发布信息的成本降到了最低,瓦解了经济、政治、文化管理机构对信息(音乐、思想、视频、新闻、游戏等等)传播的控制,使获取信息的渠道变得更加平等,过程变得更为简单。但是,由于基于HTTP运行的Web内容是超中心化的,数据中心的运作十分依赖Internet的主干网络,而且HTTP分发内容的方式从根本上讲是有缺陷的,特别缺乏可分布性和可持久性,难以成为人类知识总和的永久载体。

当我们使用HTTP进行网络查找的时候,寻找的是文件在网络上的位置,但这个位置取决于服务器管理者,用户只能寄希望于服务器没有关闭,文件维持在原来的地方没有被移动。而IPFS则从根本上改变了我们在网上查询的方式。而使用IPFS,我们查找的是内容本身,IPFS不关心中心服务器的位置,更不用说文件名称和路径,只关注文件中可能出现的内容。一个文件如果放到IPFS节点中,它会得到一个由文件内容计算出的加密哈希值,哈希值是直接反映文件内容的,哪怕只修改了1比特,哈希值也会完全不同。这样,当IPFS被请求一个文件哈希时,它会使用一个分布式哈希表找到文件所在的节点,取回文件并验证文件数据。IPFS是通用基础架构,实际上是没有存储上限的,大文件可以被切分成小分块,分散在网络上不同的地方,下载时可从多个服务器同时获取。每一个节点并不需要存储所有内容,节点所有者可以自由选择想要维持的数据。试想,如果IPFS得以普及,节点数达到一定规模,即使每个节点只存放了一点点内容,但最终所累计的空间、带宽和可靠性会远超HTTP。分布式Web会变成地球上最快、最可靠、最大的数据仓库,人类知识也不会湮灭。

2016年启动的柏林智库Blockchain for Science,其目标是“通过区块链进化(革命)来开放科学和知识创造”。该组织除了通过会议、黑客马拉松和在线平台增进知识共享之外,还发布并维护了关于区块链与科学相关的动态文档,收集关于区块链如何开启科学和知识创造的想法。根据该团队的认识,区块链技术的应用将使研究过程的许多环节能因开放而自我纠正,可能成为解决重现性和可信度危机的工具,同时还减少了许多开销,加速科学进程。根据团队收集并整理的大量应用,可总结如下:
(1)区块链可以提供公证功能,允许科学家发表具有自己独特想法的文本、文件、结果或者简单的数据。时间戳清晰展示了研究人员所声明的信息或想法的先后,这在某种程度上其实已经取代了专利局的功能。
(2)在研究设计期间就使用区块链进行注册,可以防止不符合预期的研究结果(比如负面结果)被任意丢弃,让研究设计的更改可追溯。如果使用了智能合约,那么在收集数据之前就将已经研究协议放入了“区块链”之中,最后完成了科研任务,其合同履行也是自动的。我们知道,在科研活动中,经常会出现“事后假设”的问题,也就是在证实性的资料已经收集起来之后才提出假设,由于不存在证伪的可能性,所以这种假设已经没有意义了。虽然这是许多科学研究的“诀窍”,但其实是一种浪费,所以因利用区块链的智能合约而出现的“智能证据”(smart evidence),就可以阻止事后假设的发生。
(3)有些研究数据可以自动上传,加上时间戳,并在必要时通过设备加密(比如区块链与物联网相结合),加快研究工作流程,减少错误发生。在区块链上提供研究数据,还有一个优点,那就是可利用网络的计算能力来对数据进行处理、统计分析和计算。
(4)通过区块链共享信息为学术研究市场提供了更多机会,并可加强合作。不同的实验室或团队可专注于研究工作流程的特定方面:有些实验室将致力与收集数据,而其他实验室则进行统计分析等,因为他们的努力在区块链上都能得到认可。
(5)通过区块链可以大大提高同行评审流程,并且可以提供发布结果的基础数据。这不仅可以提高总体的可重复性,还可以让评审人更彻底地完成他们的工作。加密技术,可让评审过程可以被验证保持匿名,并且可以永久保存。此外,论文出版后的各种评论还可以轻松地整合进来。
(5)使用区块链可以匿名提交想法和假设,促进更多创新。在匿名写作中,没有同行的压力,研究人员可能会进行更自由的思考,并随时分享那些并不成熟甚至离经叛道的想法。

该智库的创始人Soenke Bartling博士认为,“区块链化”( blockchained)的科学会使研究从刚开始到发表的整个过程更加公开和透明。 “科学中的区块链拥有非常独特的机会,我们可以用诚实、有效、协作和真正创造性对科学激励结构进行重新组合。”

 ttt.png

区块链如何开放研究过程。传统科学仅在出版时才开放。尽管研究初期的预注册和数据发表可以出现在研究的多个阶段,但区块链化的科学可以最全面的方式进行研究。根据CC-BY许可供图。

 

参考资料:


转载本文请联系原作者获取授权,同时请注明本文来自赵斌科学网博客。原文发布时间:2018-5-16 17:35
链接地址:http://blog.sciencenet.cn/blog-502444-1114310.html 

创建: May 18, 2018 | 21:08