《表4 测试集广告商历史点击率统计表》
这3个数据集的共同点是都来自于实时竞价广告的需求方平台,基本数据结构都是一致的,既包含类别特征也包含数值特征(广告位宽度和广告位高度).3个数据集的不同点主要体现在以下4个方面,第一,第1季数据没有用户标签特征,其他两季数据都有,用户标签是多值特征.第二,如前所述,第3季的测试集数据采集方式与其他两季不同.第三,第3季数据还有一个不同就是训练数据的数量明显少于前2季数据,后面通过实验发现由于训练数据不够充分使得第3季训练模型的泛化能力不及前2季数据集.第四,不同季的广告主工业类型不同,广告活动的数量也不同.第2季广告主、广告活动和广告创意的层次关系更丰富、更完整.
图表编号 | XD0039017000 严禁用于非法目的 |
---|---|
绘制时间 | 2019.01.20 |
作者 | 单丽莉、林磊、孙承杰 |
绘制单位 | 哈尔滨工业大学计算机科学与技术学院、哈尔滨工业大学计算机科学与技术学院、哈尔滨工业大学计算机科学与技术学院 |
更多格式 | 高清、无水印(增值服务) |