77范文网 - 专业文章范例文档资料分享平台

大数据对科学哲学的新挑战(2)

来源:网络收集 时间:2019-03-16 下载这篇文档 手机版
说明:文章内容仅供预览,部分内容可能不全,需要完整文档或者需要复制内容,请下载word后使用。下载word有问题请添加微信号:或QQ: 处理(尽可能给您提供完整文档),感谢您的支持与谅解。点击这里给我发消息

性、知性的基础,是科学认识的基本要素。通过数据科学研究范式,更能够反映现象背后的本质关系,因此它比前三种科学研究范式更深入了一步。这也说明了为什么通过大数据来寻找规律的原因。数据密集型科学研究范式“强调了数据作为科学方法的特征,这种新方法与经验范式、理论范式和模拟范式平起平坐,共同构成了现代科学研究方法的统一体”[7]。 我们如何从大数据中挖掘知识、发现规律呢?

简单地说,就是数据密集型科学研究范式从数据入手,通过对庞大的数据库进行挖掘,寻找出其中数据之间的相关关系和规律性。面对海量数据,传统的归纳法或者抽样方法都难以奏效,必须有新的数据处理方法才能高效、及时地从海量数据中发现新知识,找出新规律。近年来的数据挖掘理论与技术就是研究和处理海量数据的理论和技术,而且现在已经研制出比较成熟的数据挖掘软件,例如MapReduce 和Hadoop 并行数据处理软件,让我们可以比较轻松地实现数据挖掘的智能化、自动化[8]。

从广义来说,数据挖掘也是一种归纳法的应用,但传统的归纳法处理的是小数据,并从小数据的样本中归纳提炼,突然跳跃到适用无限样本的普适性结论。在大数据时代,我们的样本量达到海量,虽然还不是真正的无限,但已经包括了能够收集的所有样本,也就是说,大数据的归纳已经接近完全归纳法,因此其真理性应该比从小数据中归纳出来的结论要大得多。数据挖掘的本质其实就是寻找数据之间的相关性,也就是寻找数据之间的依随变化。通过相关性找到数据之间的统计规律,并据此建立合适的变量模型。概而言之,数据密集型科研范式的基础是掌握海量的数据,特别是多个学科和领域的数据融合,通过“让数据自己发声”,即通过对大数据进行关联分析,寻找事物之间的相关关系,这样既可以不易受偏见的影响,对被研究对象有新的理解视角和更好的了解,又能为研究因果关系奠定基础[7]。

四、大数据与科学说明的新模式科学最基本的任务是为经验现象找到其原因,因此在科学哲学理论中,科学说明问题是一个十分重要的问题。所谓科学说明(Scientific Explanation) 也叫科学解释,就是为科学理论的成立寻找既充分又必要的条件,也就是为科学结论找到使其能够成立的充分必要条件。科学说明有不同的进路或模式,其中最著名的是亨普尔的“演绎- 律则(DN)模型”或“覆盖律模型”。亨普尔提出DN 模型后,又提出了IS 模型来修正,以便处理概率说明[9]。随着大数据的兴起,科学说明可能添加新模式,并在说明方法以及说明目标上发生变化。

(一)在科学说明的模式上,大数据带来了相关性科学说明新模式在亨普尔的经典说明模式中,定律具有核心的地位,说明项之所以能够演绎出被说明项,就是因为定律包括了因果关系,或者表达了自然界中的某种必然性。更广泛地说,不管哪一种说明模型,传统的科学说明都是通过因果关系链来寻找一种具有必然性的因果性。这就导致了传统科学中过分追求因果关系的倾向:任何时候,任何事情都一定要找到因果关系,要多问“为什么”,并要找到最终的答案,否则就不是科学研究。在小数据时代,因为面对的数据量有限,因此有可能找到

各个数据之间的因果关系。在大数据时代,我们要面对的往往是海量数据,因此根本不可能跟踪每一个数据的前因后果,也就是说,我们几乎不可能找到每个数据的微观因果链[10]。因此,如果坚持从因果路径来为现象进行科学说明,我们将陷入无穷无尽的因果关系之中,根本就无法找到一条有限的因果链。因此,“在大数据时代,我们不必非得知道现象背后的原因,而是要让数据自己发声”[11]。“知道是什么就够了,没必要知道为什么”[11]。 通过相关性怎样作科学说明呢?所谓相关性就是两个变量之间的依随变化,其中一个变量的变化会引起另一个变量的变化,但只知道作为表面现象的依随变化,而对为什么会发生变化,即变化的内在机制,我们并不清楚。“相关关系的核心是量化两个数据值之间的数理关系”[11]。面对大数据,我们可以使用数据挖掘的手段,通过计算机自动分析数据之间的依随关系,但计算机不能深入现象背后,揭示出现象背后的本质关系。“相关关系通过识别有用的关联物来帮助我们分析一个现象,而不是通过揭示其内部的运作机制”[11]。

大数据的相关关系所揭示的是一种数据规律,是从海量数据中归纳提炼出来的具有相当似真性的规律。因为大数据挖掘是一种接近完全归纳法的数据密集型归纳法,所以其结论虽然不是普遍规律,但已具有相当大的可靠性[12]。因此,面对大数据,我们可以通过相关关系来说明现象,不再局限于因果说明。这就是说,在大数据时代,在科学说明模式中应该增加一种相关性科学说明模式,以便弥补传统因果性科学说明的局限。

(二)在科学说明的方法上,大数据带来了融贯论科学说明新方法科学说明需要适当的说明方法,只有合适的说明方法才能达到科学说明的目的。传统的科学说明,无论哪种模式,其实从说明方法上来说,都是使用还原论方法,即用一个更基本的基础来作为前因,以说明推导出来的后果。传统科学处于小数据时代,数据的采集、存储和处理都特别艰难,一个数据缺乏的年代,科学研究中要尽量减少数据的使用量。还原论的说明方法就是试图用最少的数据解释、说明最多的现象,达到以少御多的效果,因此将斑杂世界的复杂现象还原为最基本的几个甚至一个始基。因为传统科学研究基本上都属于线性关系,因此只要少量数据就可以刻画全部。

当面对非线性的复杂关系时,要么简化为线性,要么就用抽样、插值的方法粗略刻画非线性关系,因此还是用少量数据来说明、解释非线性现象。

随着辩证思维、系统科学和复杂性科学的兴起,古老的整体论也随之复兴。整体论试图从整体、全局来解释世界,例如中医一直坚持从整体的观点看人体,系统论提出要整体、全面地看问题,然而由于缺乏可操作的技术手段,这些整体论解释路径都无法最终实现,只停留在抽象的观念层面。要说明复杂的非线性现象,就必须使用大量的数据,只有使用密集型的海量数据才能精细刻画、说明人类及其精神世界等复杂非线性现象。随着大数据技术的兴起,各种数据都实现了采集、存储和处理的智能化、自动化,数据的采集、存储、传输、处理的技术问题迎刃而解,因此我们可以用海量数据来实现复杂现象的数据刻画和说明[13]。

在大数据时代,几乎所有问题都具备海量数据,当我们解决一个问题时,不再需要还原、抽样等节省数据的传统方法,而是可以使用与该问题相关的全部数据,这就是所谓的“全数据模式”。因为“全数据模式”将与问题相关的数据一网打尽,因此可以将问题刻画得更精细,更全面,不会再以点带面,以局部代全部,而是系统、全面、整体地刻画和解决问题,因此这是一种真正的整体论,是一种数据化的整体论,这种整体论是可操作、可计算、可建模的,符合现代科学范式,我们可以将这种整体论称为大数据整体论。大数据整体论方法是融合了还原和整体双方优点的融贯方法,它既将整体还原为数据细节,又因为囊括了所有数据因而具有完整性,因此用大数据来进行科学说明是一种更加精细、完整的科学说明,是融贯还原说明与整体说明的科学说明新方法。

(三)在科学说明的目标上,大数据带来了混杂性科学说明新目标科学说明究竟要达到什么目标?传统的科学说明由于是在小数据的背景下,所以一般都以精确性为目标。在小数据时代,因为数据规模小,要做到精确比较容易,而且本来数据就少,如果数据还不精确,那么我们就根本无法真正刻画现象、解决问题。

此外,由于数据规模少,我们在测量和采集数据时,也比较容易做到精确。例如,古代的土地测量、人口统计以及税收计算,都比较容易做到精确。近现代科学的可控实验和观测,也要求做到精确无误,并采取适当措施消除实验和观测误差。因此,传统科学说明要求达到精确性的说明目标,属于精确性科学说明。

在大数据时代,科学允许不精确,允许混杂、模糊、多样。正如维克托所说:“执迷于精确性是信息缺乏时代和模拟时代的产物。只有5%的数据是结构化且能适用于传统数据库。如果不接受混杂,剩余95%的非结构化数据都无法被利用,只有接受不精确性,我们才能打开一扇从未涉足的世界之窗”[11]。因此,在大数据时代,科学说明的目标必须改变,必须从追求精确到接受混杂,从传统的精确性科学说明走向大数据时代的混杂性科学说明。最终目标从精确到混杂,科学说明将从狭隘走向广阔,从封闭走向开放,这是科学说明目标变革所带来的科学进步。 参考文献:

[1]Steve Lohr.The Age of Big Data [N].The New YorkTimes,February 11,2012. [2]Rob Kitchin.Big Data,new epistemologies and paradigmshifts[J]. Big Data& Society,April-June 2014:1-12.

[3]卡尔·波普尔.客观知识[M].舒炜光,等,译,上海:上海译文出版社,1986:163. [4]P.C.Zikopoulos etc.Understanding Big Data[M].McGraw-Hill,2012:5.

[5]吉姆·格雷.吉姆·格雷论e-Science:科学方法的一次革命[A].Tony Hey 等.第四范式:数据密集型科学发现[C].潘教峰等译,北京:科学出版社,2012:ix-xxiv,XI,X-XI. [6]黄欣荣.从确定到模糊:科学划界的历史嬗变[J].科学·经济·社会,2003,(4):58-62.

[7]CODATA 中国全国委员会.大数据时代的科研活动[C].北京:科学出版社,2014:4,5. [8]J.Hurwitz,A.Nugent,F.Halper,M.Kaufman. Big Data for Dummies[M].John Wiley & Sons,Inc.2013:101,111.

[9]王巍.科学哲学问题研究[M].北京:清华大学出版社,2004:91.

[10]David Chandler.A World without Causation:Big Dataand the coming of Age of Posthumanism[J].Millennium:Journal of International Studies,2015:1-19.

[11][美]维克托·舍恩伯格,肯尼思·库克耶.大数据时代[M].盛杨燕,周涛译,杭州:浙江人民出版社,2013:67,71,72.

[12]Josh Cowls,Ralph Schroeder. Causation,Correlation,andBig Data in Social Science Research[J].Policy and Internet,2015:1-26.

[13]Nick Couldry,Alison Powell.Big Data from the bottomup[J]. Big Data & Society,July-December 2014:1-5.

百度搜索“77cn”或“免费范文网”即可找到本站免费阅读全部范文。收藏本站方便下次阅读,免费范文网,提供经典小说综合文库大数据对科学哲学的新挑战(2)在线全文阅读。

大数据对科学哲学的新挑战(2).doc 将本文的Word文档下载到电脑,方便复制、编辑、收藏和打印 下载失败或者文档不完整,请联系客服人员解决!
本文链接:https://www.77cn.com.cn/wenku/zonghe/528567.html(转载请注明文章来源)
Copyright © 2008-2022 免费范文网 版权所有
声明 :本网站尊重并保护知识产权,根据《信息网络传播权保护条例》,如果我们转载的作品侵犯了您的权利,请在一个月内通知我们,我们会及时删除。
客服QQ: 邮箱:tiandhx2@hotmail.com
苏ICP备16052595号-18
× 注册会员免费下载(下载后可以自由复制和排版)
注册会员下载
全站内容免费自由复制
注册会员下载
全站内容免费自由复制
注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信: QQ: