《表1 实验使用的模拟数据集》

《表1 实验使用的模拟数据集》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《通过区域筛选和简洁de Bruijn图比对高重复短序列》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

实验使用的计算机为8核Intel(R)Core i7-6700k [email protected]处理器,内存容量为32GB,操作系统为64位Ubuntu18.04LTS,采用C++语言编程实现算法.采用模拟数据集与真实数据集进行实验测试.对于3个参考基因组:大肠杆菌(E.coli str.K-12substr.DH10B,E.coli)、人类第21条染色体(Humanchr-21,Hc21)和果蝇(Drosophila melanogaster,DM),使用ART[26]模拟器在两种不同的Illumina平台HiSeq2000(100bp)和HiSeq2500(150bp)上,生成长度分别为100bp和150bp的模拟数据序列(reads),见下一页的表1.真实数据采用Illumina平台上的数据集,参考基因组和测序序列从NC-BI1网站获得,参考基因组规模从2Mbp到116Mbp,见下一页的表2.依据实验测试结果将所允许的种子区域向量bins最小阈值min_percent设为75%.