首页>>生活 >>内容

一种检测现实世界数据中高阶现象的工具

发布时间:2023-01-17 14:46:29编辑:愉快的缘分来源:

EPFL研究人员开发了一种新的网络分析方法,使他们能够首次揭示和解释神经科学、经济学和流行病学数据中多个变量之间的相互作用。

一种检测现实世界数据中高阶现象的工具

许多现象——例如大脑信号、股票价格或COVID住院——可以使用时间序列数据进行研究,这些数据是在给定时间间隔内作为重复测量收集的。大多数解释此类数据的工具都依赖于所谓的成对统计,它考虑了两个变量之间的相互作用。但在现实世界中,事件通常不仅仅取决于两个变量。

“想象一下在酒吧里两个人与三四个人之间的对话,或者想象一对夫妇与一对夫妇与孩子之间的互动;你添加的变量越多,动态就会完全改变,“医学图像处理实验室的EnricoAmico解释道(MIP:实验室)。Amico目前是该实验室主办的SNSFAmbizione学者,该实验室由EPFL工程学院和日内瓦大学医学院联合运营。

“作为一名计算神经科学家,我知道神经元活动是由大脑的许多不同部分协调的,但当我收集大脑数据时,我只能分析与网络节点对相关的时间序列数据;我无法分析高阶(或小组)互动,”他说。

Neuro-X研究所的Amico和AndreaSantoro认识到需要改进的计算框架来解释现实世界现象的复杂性,他们与奥地利中欧大学和意大利CENTAI研究所的同事合作,创建了一种分析高阶模型的方法多变量时间序列数据的组织。他们的开创性工作已发表在《自然物理学》上。

“简而言之,我们开发了一种从真实数据中检测和推断高阶信息的方法。这是高阶数学令人兴奋的新分支的一部分,具有在神经科学、金融和流行病学等许多现实世界系统中的潜在应用到医学、气候科学、生态学——任何东西,真的,”Amico说。

揭示与数据“宝丽来”的多元交互

研究人员将他们的新方法应用于关于大脑活动、股价波动和20世纪流行病的三个复杂的现实世界数据集。他们的高阶方法能够区分标准成对统计无法检测到的每个区域中的主要特征。正如Amico所说,每个时间序列测量都充当一种三维数据“宝丽来”,或所研究系统空间配置的快照。

例如,在大脑活动的情况下,研究人员的多变量时间序列方法能够检测到静止大脑中发生的混沌和同步神经相互作用之间的振荡。同样,在经济例子中,他们的方法能够更好地区分金融稳定和危机时期。在流行病学的例子中,研究人员甚至能够检测到流感和百日咳等不同疾病传播之间的相互作用。

“你可能会想象流行病是独立传播的,但通过我们的方法,我们能够更准确地对不同的疾病进行分类,甚至可以看到一种疾病的传播与另一种疾病的传播是如何相互作用的。”

计算能力和创造力是关键

Amico解释说,以前没有尝试过多元计算的原因很大程度上归功于计算能力的最新进展。虽然多元时间序列分析的概念很简单,但说起来容易做起来难,因为数学建模的复杂性随着每个添加的变量呈指数级增长。

“得益于现代计算能力和对大数据的访问,我们能够以新的方式使用古代数学。计算能力是关键——创造力也是如此。我们正在创造一种新的数学,创造性思维对于解决这些问题很重要。“

那么,当涉及到可以同时分析的变量数量时,天空是极限吗?理论上也许,但在实践中,没有。

“在我们的论文中,我们关注三个变量。我认为五个可能会达到当今最大计算能力的极限,”Amico说。