《表2 多元聚类算法优缺点总结》

《表2 多元聚类算法优缺点总结》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《蛋白质功能模块检测的聚类方法综述》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

多元聚类算法的优缺点如表2所示。基于蚁群聚类的PPI网络功能模块检测算法能处理任意类型的PPI网络图。多元聚类算法还可以把并行算法与蚁群算法相结合,凸显算法兼容性且具有比较好的容错性,而且在算法执行时可以利用Map Reduce的分布计算技术提高运算的速度,所获得聚类结果具有较强鲁棒性。但是,该算法对聚类参数的设置比较困难,因为聚类密度较大时设置参数的阈值很容易导致聚类结果的假阴性,且对每个蚂蚁所执行任务具有很大依赖性。基于多元蛋白质序列特征提取的蛋白质相互作用检测算法,可以对非线性的数据集进行高效运算,并且对聚类结果具有较好外推能力(获取新蛋白质的能力),但是该算法需要构建蛋白质数据模型,这是非常难实现的,目前大多数实验模型还处于理论阶段且对聚类后所获的数据难以赋予权重。基于多元密度PPI网络图聚类算法可以从整个PPI网络搜索出发,适用于任何PPI网络结构图,且可以把节点划分成多个相互作用的属性值域,在搜索过程中迭代具有随机性,且可与其他算法进行结合。但是,该类算法在实验编程时比较复杂,需要针对每个问题进行建模,然后再编码,找到最优解之后还需要对问题进行解码,这是一个复杂且耗时较长的过程。另外在实验中各参数(如交叉率和变异率)的设置直接影响解的质量,而目前这些参数的选择大部分依靠经验,算法的依赖性比较强。还有,该算法没有能够及时利用PPI网络的反馈信息进行算法整改,故搜索速度比较慢,要获得较精确的解需要较多训练时间。基于智能种群与PPI网络图的聚类算法具有良好的全局搜索能力,可以快速降低PPI网络结构的维数,而又不会陷入局部最优解的陷阱,还可以利用它的内在并行性方便地进行分布式计算,加快了计算速度。但是,该算法局部搜索能力较差,导致该算法比较费时,在进化后期搜索效率较低,容易产生早熟收敛的问题,而且编程实现比较困难。基于神经网络与PPI网络图的聚类算法的优点在于具有很强的非线性拟合能力,将PPI网络的线性节点拟合成非线性节点,可映射任意复杂的非线性关系,学习规则简单,编程实现比较容易,而且具有很强的鲁棒性、记忆能力、全局逼近能力,从根本上解决了PPI网络的局部最优问题,根据PPI网络的拓扑结构紧凑性可以对整个网络的结构参数进行分离学习,收敛速度快。但是该算法最严重的问题是没有能力解释推理过程和推理依据,具有较大的数据依赖性,而且设置数据参数较困难,一旦参数设置效果不合理,将会导致训练后所获数据噪声过高;还有,当PPI网络节点数据的密度过于稀疏时,神经网络就无法进行工作。