《表2 训练集所涉项目列表》
我们选择了12个开源项目,以自动构造神经网络的训练数据.表2给出了训练集所用工程各自的名称、版本、类的数量(NOC)、方法数量(NOM)以及代码行数(LOC).为了保证训练集样本的可靠性,我们选取了如下的12个开源项目来帮助神经网络分类器的训练.作为知名的开源项目,这些项目拥有更高的代码质量,因此可以帮助我们获取到更准确的标签样本,从而提高神经网络的训练效率.同时,我们在选取训练样本代码语料库的时候,会刻意参考项目的开发者与项目所涉及的领域.这一筛选条件的目的主要是为了消除特定开发者或特定项目领域可能会引入的特定代码风格倾向,以便保证训练集标签样本的综合性.
图表编号 | XD0056208200 严禁用于非法目的 |
---|---|
绘制时间 | 2019.05.01 |
作者 | 卜依凡、刘辉、李光杰 |
绘制单位 | 北京理工大学计算机学院、北京理工大学计算机学院、北京理工大学计算机学院 |
更多格式 | 高清、无水印(增值服务) |