博古睿讲座16 | 大数据对科学的底层思维之挑战
由北京大学博古睿研究中心主办的第16期博古睿讲座“大数据对科学的底层思维之挑战”,9月28日在北京单向空间如期举办。约有60位观众线下参与了此次活动,高峰时期1.4万人在b站观看了此次直播。
本次活动由2020-2021博古睿学者、北京大学生命科学学院教授白书农主持、与谈,带来主旨分享的嘉宾是中国科学院分子细胞科学卓越创新中心研究员吴家睿。吴老师现任国科大杭州高等研究院生命与健康科学学院执行院长,中科院系统生物学重点实验室主任。在数十年的学术生涯中,他始终关心如何结合前沿科研成果与哲学思辨,在科学与哲学相互启发与诘问的碰撞中理解生命、理解世界。
在他看来,科学植根于人类对确定性的追求,目标是能够对世间万物可理解、可解释、可操控。这种对确定性的追求主要表现为通过研究去探寻事物发生发展的因果关系;其底层思维是建立在决定论的基础之上。而大数据时代的到来给决定论带来了巨大的挑战——万物互联并彼此影响,形成了一个开放而无边界的“物联网”,因此,事物之间的本质关系是相关性而非因果性,因果性只不过是小数据时代的一种科学幻象。大数据带来的不再是经典科学时代那种完备而确定的真理,而是不完备的、可以反复“迭代”的知识。
决定论:科学的底层思维
18世纪末伟大的法国数学家拉普拉斯曾言,“我们可以把宇宙现在的状态视为其过去的果以及未来的因。如果一个智者能知道某一刻所有自然运动的力和所有自然构成的物件的位置,并有能力加以分析,未来只会像过去般出现在他面前”。吴家睿认为,这种决定论观点构成了传统科学研究的底层思维。
在本体论层面上,这种决定论体现为一种还原论(Reductionism)。正如薛定谔在1944年所著的《生命是什么》其中提到的那样,“在生物体内部发生的事件必须遵循严格的物理学定律”, 这在当时启发了很大一批物理学家、化学家,使他们意识到了生命不神秘,生命的底层不过是基因与蛋白质等生物分子,物理与化学同样可以进入生命世界。由此,分子生物学在上世纪50年代诞生了,并很快成为生物学研究的前沿与显学,成果颇丰:对蛋白质结构与模型的化学解释、对病毒感染细胞机制的生化分析……找到各种各样生理与病理活动的原因、对机制的探寻成为了生命科学中最重要的研究方向,而其底层思路便是一种对生命的还原论与决定论理解。
在认识论层面,决定论驱动的现代生物学研究的最终目标——正如克里克所说——是用物理学和化学解释全部生物学现象。受此影响,在20世纪,生物学从传统的描述性科学转变成为一门假设驱动的实验科学。与此紧密联系的是还原论占据了统治地位,即对复杂生命系统的理解可以通过将其拆解为零部件,并逐个地拿出来进行研究。通俗地说,生命就像一台大 型机器,我们只需要搞懂其每一个零件是如何运作的,生命便也就没有任何神秘与未知了。生物学家需要做的核心是提出假设,并通过良好设计的物理、化学实验来验证假设。
但是,在20世纪末出现的基于大数据的生命科学研究很快就给传统分子生物学对生命的理解带来了挑战。
大数据:开放的科学
波普尔曾言,“所有科学命题都要有可证伪性,不可证伪的理论不能成为科学理论。”其弟子拉卡托斯进一步补充为研究纲领(Research Program)。而分子生物学很好地践行了该研究纲领,首先是提出了一系列不容经验反驳的“硬核”(Hard Core)原则(如关于DNA转录RNA、RNA翻译蛋白质的中心法则),并不断调整和更新辅助性假设与成果。这是一种基于还原论的生命科学方法论特征。
而20世纪末开启的人类基因组研究计划则用了另一种方式。研究者们希望利用大数据,彻底弄清楚人类基因组,即46条染色体的基因组的30亿个碱基对排列组合情况。2001,该计划初步获得了一个完成度大约为95%的人类基因组草图,成为了生命科学研究的里程碑。直到现在,该计划还远未完成,研究或许将一直持续下去,并不断迭代与完善,让知识不断增进。这种基于大数据“迭代“的研究方法论与传统不同,它并不提出一个核心框架、原则,而是依靠数据的发现不断更新认知,把握知识的“连续性”,面向一种开放的、不可预测的结局。
生命科学领域从“还原论”走向“迭代”的方法论完成了一次库恩所述的“范式转移”(Paradigm Shifting),从假设驱动的研究范式转向数据驱动。“大数据+”的研究模式正重塑着我们对各种生理和病理的认识,发挥了显著的领域推动作用。
大数据:相关性的世界
以决定论为起点的传统生物学研究往往倾向于寻找生理或病理活动的分子原因。但是,在很多情况下,我们只能发现一种生理或病理活动的充分条件。追求确定的、充分且必要的因果关系非常困难。
而基于大数据的当代生命科学研究则不再唯一追求确定的因果关系,转向更广泛地描述相关性。例如探索饮食与疾病的发生发展之间的关系,或寻找各种疾病的风险因素:一项研究表明,每天食用水果的人与不食用水果的相比,在因心血管疾病死亡或冠心病方面分别降低了40%和34%。
基于大数据的生命观相信一种网络化的相互作用,即整个生命体的各个部分都在共同协作参与生命活动。例如我们基因组内的2万多个基因可能或多或少都参与到了一个疾病的构成。在这种理解下,相关性可以延伸很远,但因果性是极难确定的。我们每个人就像一个万物互联的生命之网,而生命则是一个由基因、蛋白质、细胞、器官、有机体层层缔造的复杂系统。
吴家睿认为,生物学面临的最大挑战是,来自研究者的决定论思维与生命的偶然性特征之间的冲突。人类始终希望有确切答案,希望找到因果关系与世界的可解释性。但实际上,生命是开放系统、复杂系统。没有造物主在40亿年前规划好了地球生命演化的每一步,所有的演化过程大多数时候是不确定的,或者说,生命是由偶然性真正推动的。这一观点与白书农在“睿ⁿ·白话”专栏中持续撰写、倡导的理念不谋而合。
主旨分享结束后,白书农对吴家睿的观点进行了更多补充,并进一步阐述到研究者或许应当仔细考虑对我们对“确定性”的偏好的来源,走出一种狭隘的生命观,并真正在站在随机性的角度理解物质世界与观念世界。
未来,北京大学博古睿研究中心将继续挖掘科学与哲学在变革时代中对“生命”的理解。我们希望走出片面阐释,在更广远的自然世界里追求一种“非确定”的答案,在大数据时代迭代认知、更新观念。
李治霖 [实习生] | 采写
简介
活动主办方:
博古睿研究院中国中心
机构单向空间
场馆活动时间:
2021-09-28
活动地点:
单向空间·东风店 / 哔哩哔哩直播
活动状态:
已结束
嘉宾
视频