公共卫生学院(深圳)田德朝副教授团队开发新算法利用Hi-C数据识别结构重组TADs

发布人:刘娜

哺乳动物染色体在细胞核内经过层层折叠形成基因组三维空间结构,其关键特征是拓扑关联域 (TADs)TADs是长度不等的连续染色质区域,区域内的染色质位点相互作用频率高于不同区域间。TADs是转录调控的功能单元,比如,可以限制增强子和启动子之间的相互作用。尽管早期研究显示TADs在细胞类型之间是稳定的,但近期越来越多的研究表明在疾病、细胞分化、体细胞重编程、神经元细胞类型之间和物种之间存在广泛的TADs结构重组。因此,通过比较分析识别结构重组TADs对于深入了解基因组三维空间结构的生物功能至关重要。目前的计算方法聚焦于TAD 边界的变化或者借助于非参数统计模型,它们在高精度TADs及单细胞Hi-C数据上的应用面临挑战。

田德朝课题组开发了DiffDomain, 一种新的用于识别结构重组TADs的可解释性参数统计方法。结构重组TADs识别指的是判定它们在两种生物条件下的Hi-C接触矩阵的差异不是由测序深度、批次效应及随机差异导致的。DiffDomain输入是在生物条件中识别的一组TADs以及每个TAD在每个条件下的一个Hi-C接触矩阵。这个设定与常规Hi-C数据分析一致,保证了DiffDomain即可以应用于Hi-C 数据也可以应用于单细胞Hi-C数据。对于每个TADDiffDomain直接计算其两个Hi-C接触矩阵的差异矩阵,然后对其进行标准化,跳过了对单个Hi-C接触矩阵进行复杂标准化的步骤。DiffDomain然后借用高维随机矩阵理论中的成熟理论结果来计算P值。多种实际数据的应用验证了DiffDomain的统计假设是合理的。随后,识别出的结构重组TADsDiffDomain细分为包含交互频率强度变化、合并、分离等六种子类型。

   基于实际Hi-C 数据上的方法比较显示,DiffDomain在假阳率和准确性方面显著优于已有方法。DiffDomain识别的结构重组TADs在多种人类细胞系和疾病状态中具有生物学相关性。结构重组TADs与结构变异和包含CTCF结合位点在内的表观遗传变化相关。DiffDomain 提升了与SARS-CoV-2感染相关的TADs重组的识别及它们与表观遗传变化的相关性分析。在高度稀疏的单细胞Hi-C数据上的应用表明,DiffDomain能够仅用百个细胞数据识别不同细胞类型之间的结构重组TADsDiffDomain能够直接量化TADs在同一种细胞类型但是不同细胞个体间的异质性(cell-to-population variability),以及 TADs在不同个体细胞之间的异质性 (cell-to-cell variability)

image-20240223193748-1

 

1  DiffDomain流程图及示例结果

作为TADs的子集,结构重组TADs有望成为多组学数据整合分析的关键单元。我们在不同的人类细胞系和疾病状态,包括SARS-CoV-2感染的A549-ACE2细胞中展示了这种应用。将DiffDomain应用于研究TAD重组与H3K27me3修饰变化之间的关系是值得探索的工作,尤其是考虑到H3K27me3最近被认为与发育和疾病相关。DiffDomain是一种可解释的统计方法,实现了更准确的TADs比较分析,并且适用于Hi-C和单细胞 Hi-C数据。随着来自多种健康和疾病状态的Hi-C及单细胞Hi-C数据的产生,DiffDomain及其改进版本有望成为Hi-C分析工具包中的重要组成部分,用于新兴的TADs比较分析,从而推动对基因组在健康和疾病中的结构—功能关系的理解。

2024113日,该研究以DiffDomain enables identification of structurally reorganized topologically associating domains”为题,在国际期刊《Nature Communications》在线发表。该研究由中山大学公共卫生学院(深圳)田德朝副教授为通讯作者,课题组硕士研究生华顿明、顾明、张筱、杜妍旖为共同第一作者,中山大学作为第一单位。

该研究得到了国自然面上项目 (项目编号12271536)、重点研发项目(项目编号:2021YFC2300102)、广东省面上项目 (项目编号:2022A1515010043)、深圳市可持续发展项目 (项目编号:KCXFZ20211020172545006) 的支持。

论文链接:https://www.nature.com/articles/s41467-024-44782-6

 

 

撰稿:田德朝课题组 

                                          初审:何嘉敏 

                                       审核:杨崇广   

                                                                                                       审核发布:汪宗芳