文献阅读:Lineage tracing meets single- cell omics: opportunities and challenges

文献阅读Lineage tracing meets single- cell omics: opportunities and challenges

以反映它们潜在的高维性质和它们的常规表示为低维欧几里得曲面或图
state manifolds; to reflect both their underlying high-dimensional nature and their routine representation as low- dimensional Euclidean surfaces or graphs.

在细胞分化过程中,状态流形可以提供高分辨率的细胞轨迹描述。

1. Inferring cell histories from state manifolds

1. Defining cell states

定义细胞类型的信息越来约丰富。

2. Mapping state manifolds

基于图的分析是有用的,因为它们转换了一组孤立的测量值(单细胞转录组)变成一个连接的结构(图表),然后可以使用一套丰富的已有的数学方法进行分析。
任何2D和3D可视化都只能作为表示更强大的数据分析形式的结果的辅助工具。
另外一类方法根据manifold来推测出细胞的动力学和分化等级。
为了改进这些在动态推断方面的努力,最近的一些研究已经成功地推断了状态的瞬时动态,其基础是新生mRNA丰度的测量、剪接与未剪接mRNA的比率(例如,RNA速度)、蛋白质翻译或由代谢物标记的mRNA周转率。还有时序性的信息。

3. Limitations of state manifolds for dynamic inference

在这方面,树状细胞状态层次结构与真正的谱系分析得到的细胞状态层次结构形成了鲜明的对比。在一个状态流形上,分支点可能是假设的:细胞分裂可能发生在一个分支点上,也可能不发生在一个分支点上,来自每个分支的两种细胞都可能沿着流形的一个分支前进,而不是探索所有的分支。相反,在谱系树中,每个分支点都严格对应于一个分支事件。状态轨迹甚至不需要是严格的树状结构,而谱系层次结构总是严格的分支树。因此,尽管种群水平结构可以追踪单个细胞经历的分子状态的动态序列(图2a,b),但一些特定的原因可能会模糊或误导研究人员对潜在的动态和/或命运关系的理解。

2. Inferring cell histories in lineage tracing

1. Lineage-tracing paradigms

2. Clonal versus population tracing

3. Imaging-based methods for lineage tracing

4. Lineage tracing by barcode-sequencing

5. Performance, trade-offs and further innovations

6. Prospective lineage tracing on state manifolds

3. Applications of lineage tracing on state manifolds

1. Lineage phylogenies on state manifolds

2. Clonal resampling on a state manifold

3. Computational tools for state–lineage mapping

4. Pitfalls in lineage barcoding on a state manifold

阅读重点

4. Emerging concepts

1. State manifolds as models

状态轨迹和谱系编纂了细胞发育历史中两个不同但互补的方面,每一种类型的分析都可以为个体发生和基因调控提供见解。在这篇综述中,我们概述了状态流形的一些重要局限性,并描述了将真实谱系测量与单细胞组学相结合的动机和工具。从这些方法的早期应用,我们提出了三个新兴的概念:第一,状态流形作为模型;第二,细胞状态分岔与细胞分裂的耦合模式;第三,树描述细胞分化层次的有效性

在这篇综述中,我们提出了lineage和state representations之间可能出现的矛盾(图2)并讨论了如何利用克隆信息来阐明这些发育关系。这些矛盾证明了状态流形(state trajectory)不是绝对可靠的。相反,它们是数据驱动的模型,遵循特定的假设集和数据处理标准。

目前,大多数状态流形是由原始状态测量中最主要的covariation以无偏方式构造的。在这种做法下,scRNA-seq manifold的定义特征将反映健壮的、可变的转录特征,因此不能保证强调细胞命运的决定,这可能与命运决定发生时低水平表达的调控基因相关

到目前为止,状态流形的构建都没有包含来自克隆数据的信息。然而,状态和谱系关系不需要保持冲突:一旦谱系的信息被建立,它可以用来改进我们表示状态流形的方法。例如,谱系信息的直接和简单的使用是在鉴定偏向谱系的祖细胞状态的分子标记。事实上,新的命运标记已经从结合的谱系和状态系统发育实验和克隆-重采样研究中推断出来。

谱系信息也可以用来训练构建状态流形的算法,以避免如图2所示的错误。这样的行为需要一个概念上的转变,即把state manifolds作为一组特定的高维基因表达特征的模型,而不是作为覆盖细胞分化轨迹的绝对或普遍参考。

2. Variability of individual lineage trees

state manifolds和mitotic lineage trees都可以定义层次结构。这两个等级之间关系的本质是什么?提出两种可能的关系:一种是mitotic coupling 和population coupling. mitotic coupling 是确定的,当细胞state manifolds的分支点与细胞分裂事件紧密对应时,就会发生有丝分裂偶联(图6a,左)。海鞘87和秀丽隐杆88的确定谱系树就是很好的例子。
相比之下,population coupling将发生在克隆和分裂历史不影响任何单个细胞的前进或其命运选择。相反,细胞行为是不确定的,可以用一组沿特定轨迹移动的转移概率来描述。
因此,种群耦合可能导致高度可变的谱系树,类似于那些随机分支过程,不会在生物体内部或生物体之间精确复制。在这种情况下,对命运等级结构进行高分辨率重建的努力可能无法产生一个单一的具有代表性的谱系发展树,但状态-谱系耦合在多个观察到的谱系树上的分布应该被证明具有很高的信息量

分化的层次的结构是什么?
这个问题的答案首先取决于一个人考虑的是state manifolds和mitotic lineage trees。

在没有细胞融合的情况下,谱系通常可以看作是一个分支树,每个分支点代表一个有丝分裂事件。状态流形可以是树状的,但根据系统的生物学特性,它们不一定是树状的。因此,状态流形代表了发现细胞分化过程的结构(即拓扑)的机会。当状态流形与谱系测量相结合时,人们就有机会独立地拒绝或确认关于这些结构的特定假设。正如我们上面所描述的,几个最近的研究已经证明了状态收敛(state convergence)的证据,在状态流形上,两个或更多不同的命运轨迹收敛到相同的最终位置。因此,这种端点状态由起源不同的细胞组成,这些细胞可能保留也可能不保留不同的功能或电位。我们回顾了免疫细胞、神经嵴谱系和内胚层群体状态收敛的例子。相反的情况,状态分化(state divergence)也被观察到,有丝分裂的姐妹细胞(谱系高度相关)迅速进入不连续状态。state manifolds可以发生作为不对称细胞分裂的结果,特别是在分裂的细胞质组分只传递到两个有丝分裂子细胞之一的情况下。这种情况下可能会产生缺乏中间状态的状态转换,因此在任何采样深度上都不会以分岔事件的形式出现在状态流形上。这两种情况——收敛和发散——将导致状态流形偏离严格的树状结构,并可能由描述良好的生物情况产生。

谱系和流形的关系,强调谱系的重要性,以及流形结构的局限性,需要结合两者来看。

文献阅读 Statistical mechanics meets single-cell biology

疑问:waddington state manifolds的概念及应用

统计力学来帮助我们从单细胞特性(微观状态)的角度来加深对组织功能(宏观状态)的理解。

沃尔顿图谱的三个重要基本概念:

  1. 首先,有机体的细胞可以杰出的发展可能产生广泛的不同数量的其他细胞,表明分化效力层次的存在,传统上被描绘为高度的景观,这暗示着一个势能函数的存在。
  2. 第二,细胞优先占据特定的稳定区域,Waddington称之为“局部吸引子”,与观察到的细胞类型相对应。
  3. 景观是“渠化”成特定的吸引盆地,定义了连接吸引子状态彼此的低能量路径。

GRN- based Waddington landscapes

从scRNA- seq数据建模的状态流形对于深入理解细胞生物学和实现分子和再生医学的目标是至关重要的。它需要对三个主要的景观特征进行推断:代表功能相关细胞类型的局部吸引子状态,它们在歧管中的海拔高度,影响它们的分化潜能,以及通常称为的低能量路径
“沿袭轨迹”,将这些吸引子状态连接在一起

为什么随机过程是单细胞动力学的恰当描述,主要有两个原因。

  1. 首先,在同一细胞中,在流形的的不同位置测量转录组是不可能的,因为测量的行为本身就会破坏细胞。
  2. 其次,细胞内的分子经历了真正的随机变化,而不是连续变化28,31,45,这意味着在最基本的层面上,单细胞动力学是概率的。然而,值得注意的是,确定性连续型单细胞动力学可能仍然来自潜在的概率过程

State manifolds from scRNA-seq data

Solving the drift–diffusion equations: inference of the state manifold.

Modelling cell types as local attractors.

Bottom-up modelling of potency

细胞多能性的预测有两种方法,一种是bottom-up,只从细胞测量数据出来,推算细胞潜能,可能受到数据噪音的影响,另一种是up-bottom,测量的是相对潜能,需要进行类比。

细胞多能性相关参数
包括染色质的开放程度,蛋白质-蛋白质相互作用(PPIs)的频率和hubness和表达基因的总数量(基因计数)

Modelling cell-fate transitions

Future outlook and perspectives