近年来科学最伟大的成就之一是获得从生物体中提取的数千个单个细胞的信息的技术。这项技术包括个体细胞(基因组学,表观基因组学,转录组学,蛋白质组学)的所谓“组学”,它为我们提供了有关数千个单细胞基因组的数据,其中各种基因的状态和活性,以及这些细胞中存在各种蛋白质。
将关于每个单元的数据呈现为高度多维空间中的点是方便的。因此,使用这项新技术,世界各地的科学家们在巨大的空间中获得了数千个点(细胞)。
基于数据分析方法的研究,包括拓扑和几何分析,“拓扑语法”,“主要图形方法”,“数据近似”等,是新的重要元素(在投资和参与者数量方面都是巨大的)用于生物体数据采集的技术。这项新技术涉及单细胞的“组学”。这些数据为生物学和个性化医疗的发展开辟了巨大而尚未完全实现的机会。
分支开发时间的想法允许人们将生成的数据山转换为更易理解,可读和可解释的形式。我们可以想象每个细胞都处于一些发展轨迹上。这些轨迹可以在其开发中的单元从几个可能的变体中选择一个未来变体的点处分支。几何上,这些具有分叉点的发展轨迹代表分支开发时间。
国际大型研究团队开发了一项从数据中提取分支时间的新技术,其中包括来自6个国家的15位科学家:美国,中国,法国,,英国和俄罗斯。
使用基本变换语法构造复杂树。在基本算法的每个步骤中,选择在数据近似的质量中给出最大增益的基本变换。
用于处理一般性复杂数据的拓扑语法的方法早在2007年由Alexander Gorban教授(英国,目前监督在下诺夫哥罗德Lobachevsky州立大学实施一个超级大国)和他的前学生Andrei Zinoviev(法国目前正在与罗巴切夫斯基大学合作实施这一标准。
分支时间(或者,通常称为伪时间)的概念在生物学中以如下方式产生:发生在它们中的细胞和事件沿着某个图形放置(或者,更正式地,一维连续体) ,因为图是一个离散的对象)。这种分支连续体在发育和分化事件的分析中起着与其他区域中的线性时间(事件放置的比例)相同的作用。不涉及神秘或修改物理时间。人们已经引入了这个概念,其中许多人都使用它。这很方便。该规模的拓扑结构是从数据分析中提取的。接下来,数据按此比例映射。“
Nizhny Novgorod罗巴乔夫斯基大学Alexander Gorban教授
该方法作为哈佛大学L. Pinello组织的广泛国际合作的一部分进一步发展,并用于创建专门的软件产品STREAM,它基于所有单细胞的“组学”数据建立细胞发育的分支时间。 。
“想象一下,最近,我们非常愉快地学习了解人类基因组的解码。提出的新技术使得有可能同时确定基因和其他重要数据的状态和活动成千上万。从身体取出的细胞。这些信息将分别为每个细胞确定,而不是通过给出某种平均值。因此,将提供关于个体生物的发育和各种疾病如癌症的起源的极其重要的信息。但是,必须能够从这些数据中读取,解密和提取有用的信息。我们提供了一种工具来处理这些数据并从中提取重要信息,“继续Alexander Gorban。
“图形及其在数据空间中的嵌入都是同时构建的,然后这种嵌入用于映射所有数据。也就是说,一个高度多维的空间(数十万的维度)被简化为分支的 - 尺寸连续体,“Alexander Gorban总结道。
标签:细胞发育
郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。