文献:
UMAP和TSNE忽略了原始空间中数据点的局部密度,结果产生了误导的可视化,密集分布的细胞子集被给予了比它们在数据集中的转录多样性所产生的更多的视觉空间。
局限性:两种方法的目的都是在可视化中准确地保留每个数据点的原始局部邻域,同时更允许远程畸变。换句话说,原始数据中相邻的数据点与相邻的数据点在可视化中没有区别。
在scRNA-seq数据中,这一遗漏的异质性信息与细胞亚群中基因表达的可变性相对应。因此,在可视化中准确描述局部密度的差异可以提供另一个“维度”的信息,反映迄今为止对单细胞转录组学景观的隐藏的洞察力。
为此,我们发展了一种广义的、可微分的局部密度测度,称为局部半径,它直观地表示到一个给定点的最近邻居的平均距离