首页>>教育 >>内容

对数学真理和复杂模型的追求如何导致无用的科学预测

发布时间:2022-11-06 11:33:01编辑:愉快的缘分来源:

科学界的一个主流观点是,有一个数学真理构成了宇宙。假设科学家的工作是破译这些数学关系:一旦理解,它们就可以转化为数学模型。在计算机中运行生成的“硅现实”可能会为我们提供有关世界如何运作的有用见解。

对数学真理和复杂模型的追求如何导致无用的科学预测

由于科学不断揭示秘密,模型不断变大。它们整合了发现和新发现的机制,以更好地反映我们周围的世界。许多学者认为,更详细的模型会产生更清晰的估计和更好的预测,因为它们更接近现实。但我们发表在《科学进展》上的新研究表明,它们可能会产生相反的效果。

“越详细越好”的假设跨越了学科领域。后果是巨大的。大学拥有越来越强大的计算机,因为他们想要运行越来越大的模型,需要越来越多的计算能力。最近,欧盟委员会投资了80亿欧元(69亿英镑)来创建一个非常详细的地球模拟(与人类一起),被称为“数字双胞胎”,希望更好地应对当前的社会和生态挑战。

在我们最新的研究中,我们表明,追求更复杂的模型作为产生更准确估计和预测的工具可能行不通。基于统计理论和数学实验,我们运行了数十万个不同配置的模型,并测量了它们估计的不确定性。

我们发现更复杂的模型往往会产生更多不确定的估计。这是因为添加了新的参数和机制。需要测量一个新参数,例如口香糖对疾病传播的影响,因此会受到测量误差和不确定性的影响。建模者也可以使用不同的方程来数学描述相同的现象。

一旦这些新增内容及其相关的不确定性被整合到模型中,它们就会堆积在已经存在的不确定性之上。并且不确定性随着每次模型升级而不断扩大,使得模型输出在每一步都变得更加模糊——即使模型本身变得更加忠实于现实。

这会影响所有没有适当验证或训练数据来检查其输出准确性的模型。这包括气候变化、水文(水流)、粮食生产和流行病学等全球模型,以及预测未来影响的所有模型。

模糊结果

2009年,工程师创建了一种名为GoogleFluTrends的算法,用于预测美国与流感相关的就诊比例。尽管基于人们输入谷歌的5000万个查询,该模型无法预测2009年的猪流感爆发。然后,工程师们使不再运行的模型变得更加复杂。但它仍然不是那么准确。由德国心理学家GerdGigerenzer领导的研究表明,它一直高估2011-13年的就诊次数,在某些情况下高估了50%以上。

Gigerenzer发现一个更简单的模型可以产生更好的结果。他的模型仅根据一个很小的数据预测每周流感发病率:有多少人在前一周看过他们的全科医生。

另一个例子是全球水文模型,它跟踪水的移动和储存方式和地点。他们在1960年代开始简单,基于“蒸散过程”(可以从植物覆盖的景观中蒸发和蒸腾的水量),并很快得到扩展,考虑到全球范围内的家庭、工业和农业用水。这些模型的下一步是模拟地球每小时每公里的用水需求。

然而,人们想知道这个额外的细节是否会让它们更加复杂。我们已经表明,八个全球水文模型产生的灌溉用水量的估计值可以仅用一个参数来计算——灌溉面积的范围。

前进的道路

为什么直到现在都忽略了更多细节会使模型变得更糟的事实?许多建模者不会将他们的模型提交给不确定性和敏感性分析,这些方法告诉研究人员模型中的不确定性如何影响最终估计。许多人继续添加细节,却没有弄清楚他们模型中的哪些元素对输出中的不确定性负有最大责任。

这令人担忧,因为建模者有兴趣开发更大的模型——事实上,整个职业生涯都建立在复杂的模型之上。那是因为它们更难伪造:它们的复杂性会吓倒外人,并使理解模型内部发生的事情变得复杂。

然而,有补救措施。我们建议确保模型不要为了它而变得越来越大。即使科学家确实进行了不确定性和敏感性分析,他们的估计也有可能变得如此不确定,以至于它们对科学和政策制定毫无用处。在计算上投入大量资金只是为了运行估计完全模糊的模型是没有意义的。

相反,建模者应该思考不确定性如何随着模型中每一个细节的增加而扩大——并在模型细节水平和估计中的不确定性之间找到最佳权衡。

为了找到这种权衡,人们可以使用“有效维度”的概念——一种对最终输出增加不确定性的参数数量的度量,考虑到这些参数如何相互影响——我们在论文中定义了这一点.

通过在每次升级后计算模型的有效维度,建模者可以评估不确定性的增加是否仍然使模型适合政策——或者相反,它是否使模型的输出变得如此不确定以至于无用。这增加了透明度并帮助科学家设计更好地服务于科学和社会的模型。

一些建模者可能仍然认为添加模型细节可以导致更准确的估计。现在举证责任在他们身上。

期刊信息:科学进展