本站小编为你精心准备了大数据对科学活动的影响参考范文,愿这些范文能点燃您思维的火花,激发您的写作灵感。欢迎深入阅读并收藏。
一、知识生产方式和科学进步模式的变化
首先,知识生产对技术与资本的依赖性增强。大数据时代,科学研究与信息技术手段之间的联系越来越紧密。以大数据技术进行的研究需要极多的资源,收集、储存、保留、管理、分析和共享海量数据各个环节都需要设备、技术与人才,获得相当的科研资金才可能进行。先进的数据处理技术既对科学研究提供了有力和有效的手段,又造成了科研路径上的依赖甚至是障碍。研究者若没有相应的技术与设备,就无法获得足够的数据和深入的分析处理。因此,资源以及获取资源的能力决定着科学家事业的前途,资本对知识生产的控制力将得到空前的强化。例如美国和加拿大海洋气象台的海王星项目拨出大约30%的预算用于信息化基础设施(将近1亿美元),而小实验室的科学家只能用免费的EXCEL来处理数据。其次,知识生产更倾向于工程化协作。由于使用大数据系统需要昂贵的技术成本,这使得科学家之间形成合作联盟,共享仪器设备与技术服务。如LHC每年将产生50-100PB的数据,其中大约20PB数据通过国家级网格的全球联盟进行存储和加工,这一联盟连接了100万台CPU。
除了节约成本的考虑外,产生大数据的项目大多本身就是一个大科学工程,需要科研人员进行跨越多个领域的协同工作、各个领域的专家共同解决一些复杂问题。例如海洋观测站计划(OOI)的电缆部件研究由华盛顿大学负责,维多利亚大学领导了在加拿大的工作,美国海洋规划协会管理和整合整个OOI系统,伍兹霍尔海洋研究所和加利福尼亚大学圣地亚哥分校分别负责管理项目的沿海-全球部分和网络基础设施部分。再者,科学进步日益共享化与全球化。在工程化协作中所实现的科学进步,实质上也是一种共享式进步。得益于大规模计算能力、存储能力和科学仪器的共享支持,科学家们能够方便地获得和使用大量的来自其他科研团队的科学数据。例如,2009年丹麦第一例H1N1感染者得到确认的几天之后,H1N1病毒中的H1亚单位序列的全部1699个碱基就被提交到了EMBL-Bank(欧洲分子生物学实验室核酸序列数据库),此后美国、意大利、墨西哥、加拿大、以色列等多个国家都提交了更多的病毒亚单位序列数据。在这样的共享中,研究周期和研究费用将大幅度缩减,从而提高了科学进步的速度与质量。大数据还使得科学进步日益呈现出全球化的效应。例如微软全球望远镜(WWT)作为国际“虚拟天文台”的一部分,现在可以无缝链接到天文学家们已经习惯的定量研究工具上。在这样的研究模式中,科学家足不出户就能获得其他国家的技术设备与科研成果,来自全球的数据和信息能够被用来为某一研究课题服务,得出的成果原则上是一种全球性的成果。
二、反思:大数据的利与弊
从积极的一面来看,大数据或将开创科学研究的“第四范式”。大数据相关的科研方法将在越来越多的领域中发挥重大的甚至是决定性的作用。有了数据处理系统的辅助,科学家可以把精力集中在创造性的劳动上,大数据不会自动产生科学知识,但至少增加了科学家做出科学发现的时间和可能。一批乐观的科学家更是看到了大数据对科学的变革力量。2007年,已故图灵奖得主吉姆•格雷(JimGray)把数据密集型科学从计算科学中区分出来,提出了数据密集型科学研究的“第四范式”。科学研究最早的两种范式是实验型科研与理论型科研,第三种范式即计算型科研通过利用计算能力发挥理论的作用,第四种范式则是在未知规律的情况下,运用计算能力从大数据中发现规律。依赖大数据也可能带来众多负面影响。一是科研资源垄断可能加剧。科学家能否进入大数据的研究平台,受制于海量的科研数据是否开放,也取决于是否有相应的设备来获取和处理这些数据。大数据与资本紧密结合的特性强化了科研资源掌握者对科研的走向与产出的控制。二是科学家可能形成技术路径依赖。数据技术只能对丰富而且复杂的真实世界提供相对简略的描述。更进一步而言,寻找不同寻常和意料之外的东西需要创造性和洞察力。计算机和数据库不可能自动导致创造性的科学发现,科学家如果过分依赖数据资源和搜索工具,就会造成亲身实践获取“第一手”资料的能力退化。三是科学合作的成果归属易引起纷争。首先,对于数据提供方能否算作合作者并给予一定的署名权存在争议;其次,对于工程化和全球化协作产生的成果是属于集体智慧的,对于成果的所有权该如何分配?2013年的诺贝尔物理学奖仅颁给两位理论创始人弗朗索瓦•恩格勒特和彼得•希格斯,而发现希格斯玻色子的几千名粒子物理学家却无缘此荣誉,这引起了包括诺奖评委安德斯?巴拉尼在内的抗议。最令人担心的是,随着科学和技术和商业性的开发越来越联系紧密,一些具有商业价值的科学信息和数据为拥有者所不愿意公开,甚至通过申请专利来实施保护,这将带来更大范围的不公平与纠纷。大数据是对人类信息处理能力的挑战,对科学家们来说则是面临着科研数据爆炸式增长的威胁,如果没有应对好,科学可能就无从进步。科学家们面对数据的泛滥,还应该从根源上去反思,比如实验思路是否出了问题。同时,大数据是应对数据挑战而提出的技术系统,这也使得科学研究与技术手段之间的界限越来越模糊,科学能力甚至在某种意义上转化为了技术能力,这对科学与技术之间的关系提出了新的问题,值得学者们深入研究。
作者:刘伟榕王秋君单位:厦门大学人文学院