《表3 染色体结构重构工具》

《表3 染色体结构重构工具》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《细菌三维基因组学研究》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

在得到预期空间距离矩阵后,构建目标函数和约束条件以便优化结构.目标函数一般是使目标结构的空间距离矩阵与预期空间距离矩阵差异最小,约束条件可以选择相邻bin之间的距离约束以及非相邻bin之间的最大或最小距离约束.优化结构一般采用迭代方法,从随机生成的初始结构出发,用启发式迭代方法进行结构优化,直至得到最优的结构,如TADbit中的蒙特卡罗采样[52].基于约束的建模可以得到优化的模型,但由于初始结构是随机的,最终得到的结构有多种不同的可能性,这依赖于具体算法和数据的可靠性.随着测序分辨率的提高,交互矩阵的规模越来越大,计算量与内存使用量也越来越大,基于约束的建模很难在可接受的时间范围内得到有效的结构.多尺度建模可以很好地平衡计算速度和结构的可靠性.多尺度建模通常分为3步:识别真核中的拓扑相关结构域(topologically associating domains,TAD)或原核中的染色体交互结构域(chromosomal interaction domains,CID),构建结构域的结构,再将结构域进行整合得到最终结构[53].TAD识别可以采用图像分析技术,将每个交互强度数据看作一个像素点,识别对角线上的正方形区域作为TAD.由于机器学习方法在图像处理中有广泛应用,所以也被用到了TAD识别问题上,如ClusterTAD[54].TAD结构域的结构重构可以采用上述基于约束的方法,而最终结构的整合则可以采用Kabsch算法[55].此外,ShRec3D则采用了距离几何方法来计算bin的坐标[56].现已发表的基于交互数据的染色体三维结构重构工具如表3所示.基于图2中的交互数据,采用ShRec3D工具重构得到大肠杆菌、新月柄杆菌、枯草芽孢杆菌和肺炎支原体的染色体结构如图3所示.